Telegram (AI) YouTube Facebook X
En
робот под водой, как он исследует подводный морской мир AI seabed

Ученый назвал физическое мышление главным препятствием для ИИ 

Проблему решат продвинутые «модели мира»

Искусственный интеллект пока не способен в полной мере понимать физический мир. На сегодняшний день это главная проблема технологии, заявил профессор компьютерных наук Стэнфордского университета Фэй-Фэй Ли.

«Ведущие ИИ-технологии вроде больших языковых моделей (LLM) изменили способ получения нами доступа к абстрактным знаниям и работы с ними. Тем не менее они остаются мастерами лишь на словах: красноречивыми, но неопытными, знающими, однако необоснованными», — считает он. 

По мнению ученого, появление «пространственного интеллекта» изменит то, как люди «создают и взаимодействуют с реальными и виртуальными мирами, совершив революцию в литературе, искусстве, робототехнике, науке и не только».

Создание такой технологии требует обучения моделей не только на «языке», но и на физических свойствах мира. 

Ли утверждает, что искусственный интеллект быстро приближается к пределам возможностей текстового обучения, и в конечном итоге его прогресс будет зависеть от «моделей мира» — нового типа генеративного ИИ, который должен решать принципиально иной набор задач, чем LLM.

«Такие системы должны генерировать пространственно согласованные миры, подчиняющиеся физическим законам, обрабатывать многомодальные входные данные — от изображений до действий — и предсказывать развитие этих миров», — объяснил Ли. 

Согласно видению профессора, пространственный интеллект представляет собой «границу за пределами языка — способность создавать взаимосвязь».

Идея «моделей мира»

Концепция появилась в начале 1940-х в ходе исследований шотландского философа и психолога Кеннета Крейка в области когнитивной науки. 

Идея вновь возникла в современном ИИ-пространстве в 2018 году после статьи Дэвида Ха и Юргена Шмидхубера о том, что нейросеть может обучиться и воссоздать компактную внутреннюю модель окружающей среды и использовать ее в качестве симулятора для планирования и управления.

Однако решение задачи требует создания сложных систем, способных хранить пространственную память и моделировать сцены в более чем двух измерениях.

В сентябре компания Ли, World Labs, выпустила бета-версию Marble — ранней «модели мира», которая создавала интерактивные трехмерные среды с помощью текстовых или графических подсказок.

Пользователи могли перемещаться по сгенерированным средам без ограничений по времени или подгрузки сцен, а окружающая среда оставалась единой, не менялась и не распадалась.

Пример работы Marble. Источник: World Labs.

«Следующим рубежом развития ИИ станет пространственный интеллект — технология, которая превратит видение в рассуждение, восприятие в действие, а воображение в творчество», — сказал Ли, назвав Marble лишь первым этапом.

Напомним, в октябре Nvidia представила систему для подключения квантовых компьютеров к ИИ-чипам компании. Технология значительно ускорит обработку данных и откроет новые возможности для исследований в медицине и материаловедении. 

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK