
Пътник излиза от самоуправляващо се безпилотно такси в квартал Нанша, Гуанджоу, на 18 юли 2025 г. [Photo/Xinhua]
Световните модели – невронни мрежи, предназначени да разберат и симулират динамиката на реалния свят, включително физически свойства и пространствени отношения – се очертават като следващата стратегическа граница за подпомагано шофиране с помощта на изкуствен интелект, като производителите на автомобили и технологичните гиганти удвояват усилията си в сектора, за да подобрят начина, по който превозните средства възприемат, предвиждат и действат в сложни среди, казаха експерти от индустрията.
„Моделът на света разбира какво се случва във физическия свят в този момент и предвижда какво следва, включително възможностите за планиране“, каза Арнолд Гао, вицепрезидент анализатор в изследователската фирма Gartner.
Като един от основните подходи във физическия AI, световните модели привлякоха вниманието в технологичните индустрии. Gartner изброи физическия AI като една от Топ 10 стратегически технологични тенденции за 2026 г., като се има предвид способността му да взаимодейства с реалния свят и най-представителните му приложения в индустрията за автономни превозни средства и роботика.
За разлика от големите езикови модели, на които липсват директни симулационни и предсказващи възможности за физическа среда, световните модели научават представяния от сензорни данни и прогнозират динамика като движение, сила и пространствени отношения.
Например, когато превозно средство се сблъска с потенциална аномалия отпред, световният модел непрекъснато генерира множество възможности за следващата секунда – дали да спре, да смени лентата или да предприеме други превантивни мерки, каза Гао.
„Именно тази прогнозна симулация позволява на автономните системи да вземат по-надеждни, човешки решения“, каза той, добавяйки, че много усъвършенствани системи за подпомагане на водача, които в момента са на пътя, вече следват подхода на световния модел.
Според бяла книга, публикувана от Frost & Sullivan, обхващаща сектора на световните модели на Китай, повече от 80 процента от алгоритмите за автономно шофиране сега използват световни модели за спомагателно обучение. Чрез автоматично генериране на самомаркирани изображения и видео данни и създаване на мултимодални, кръстосани времеви сценарии без тежък ръчен дизайн, световните модели могат да намалят разходите с близо 50 процента и да подобрят ефективността с около 70 процента, се казва в него.
На този фон китайските автомобилни производители ускоряват разработването и внедряването на световни модели в автомобилите.
През септември Qiankun ADS 4.0 на Huawei започна да се появява в своите автомобили. Захранван от собствено разработената архитектура WEWA на компанията, той включва базиран на облак световен двигател за широкомащабно обучение на данни и генериране на сценарии, както и архитектура на поведението на света на автомобила за екологични разсъждения в реално време и вземане на човешки решения.
Nio също така обяви планове за въвеждане на Nio World Model (NWM) 2.0 в множество платформи от края на тази година до първото тримесечие на следващата година. Първата версия на NWM, внедрена от май, може да симулира 216 потенциални сценария в рамките на 100 милисекунди, да избере оптимален път чрез алгоритмично филтриране и да емулира човешки пространствено-времеви разсъждения с инстинктни предсказващи способности.
Тъй като бързото възприемане на световни модели в автономното шофиране изисква по-нататъшен напредък в съответните технологии, световни технологични гиганти като Nvidia, Google и Tesla също увеличават усилията си в тази обещаваща нова област.
През януари Nvidia представи Cosmos, платформа за модел на генеративна световна основа, която може да произвежда огромни количества реалистични, базирани на физика данни за обучение и оценка на автономни превозни средства, роботи и други физически AI системи.
Ходът беше последван от Google DeepMind, който стартира Genie 3 през август – световен модел от ново поколение, който позволява взаимодействие в реално време за първи път. С текстова подкана Genie 3 може да генерира динамични светове, които могат да се навигират при 24 кадъра в секунда, поддържайки последователност на сцената за няколко минути при резолюция 720p.
„Прилагането на световни модели в автономното шофиране ще разреши много настоящи тесни места“, каза Уей Донг, инженер в лабораторията по микроелектронни технологии на Технологичния университет в Сиан.
„Например световните модели могат да генерират реалистични видеоклипове от сцени на шофиране, които се използват за обучение на роботи и автономни превозни средства, позволявайки на разработчиците да провеждат обучение и тестване във виртуална среда“, каза Уей.
Освен генерирането на виртуални обучителни среди за роботи и самоуправляващи се превозни средства, Уей каза, че произведените от световни модели реалистични видеоклипове са много по-рентабилни от традиционното събиране на данни и също така позволяват обработка на данни в затворен цикъл, подобрявайки ефективността и точността, като същевременно ускоряват итерацията и оптимизацията на системата.
„Със световните модели системите от край до край получават по-надеждни предпазни мерки и по-голям потенциал за подобрение“, добави Вей.
[email protected]
Нашия източник е Българо-Китайска Търговско-промишлена палaта