DeepMind создала универсальных ИИ-агентов в неограниченной игре

DeepMind-min
DeepMind-min

Ученые из британской лаборатории DeepMind создали обширную игровую среду XLand для обучения универсальных агентов искусственного интеллекта. Они могут выполнять задачи, которые им никогда не встречались.

Вместо того, чтобы обучать агентов ограниченному количеству задач, команда исследователей определила целую вселенную ситуаций, которые могут быть сгенерированы процедурно.

DeepMind создала универсальных ИИ-агентов в неограниченной игре
Устройство вселенной XLand. Данные: DeepMind.

Вселенная XLand включает ряд многопользовательских трехмерных игр. В ее пределах агенты провели 700 000 уникальных сессий в 4000 миров. Каждый агент в последнем поколении прошел 200 млрд шагов обучения в результате выполнения 3,4 млн уникальных задач.

В итоге разработчики получили алгоритм, способный успешно решать широкий спектр задач — от простого поиска объектов до сложных игр, таких как прятки или захват флага, которые не встречались во время обучения, сообщили ученые.

«В настоящее время наши агенты могут участвовать во всех процедурно созданных оценочных задачах, за исключением нескольких ситуаций, решить которые не смог даже человек», — говорится в исследовании.

По словам ученых, агенты демонстрируют общее эвристическое поведение, которое широко применимо ко многим задачам.

«Этот новый подход знаменует собой важный шаг на пути к созданию более универсальных агентов, способных быстро адаптироваться в постоянно меняющейся среде», — добавили они.

Напомним, в июне исследователи из DeepMind заявили, что для достижения общего искусственного интеллекта достаточно обучения с подкреплением.

В июле специалисты ИИ-лаборатории собрали и опубликовали самую полную базу данных белковых структур человека, созданную нейронной сетью AlphaFold.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK