OpenAI обучила языковую модель решать математические задачки

OpenAI-min
OpenAI-min

Специалисты организации OpenAI обучили систему искусственного интеллекта решать несложные математические задачки для начальной школы, условия которых записаны в текстовом формате.

Точность алгоритма составила 55% — в два раза выше, чем у специально настроенной модели GPT-3. Для сравнения: в этом же тесте школьники в возрасте от 9 до 12 лет набирают 60%.

По словам разработчиков, достигнутый результат очень важен:

«Современный ИИ все еще довольно слаб в многоэтапных рассуждениях, которые с легкостью удаются даже школьникам».

Исследователи достигли таких результатов благодаря обучению модели распознавать свои ошибки и искать правильный ответ до тех пор, пока не найдет работающее решение.

Также разработчики представили набор данных GSM8K, собранный для тренировки алгоритма. Он состоит из 8500 высококачественных словесных задач по математике для начальной школы. Для их решения требуется от двух до восьми шагов, на каждом из которых необходимо выполнять элементарные арифметические вычисления.

Набор данных GSM8K доступен всем желающим на GitHub.

Напомним, в октябре OpenAI разработала модель генерации коротких выжимок из художественных книг.

В августе компания представила ИИ-инструмент Codex для автоматического написания программного кода.

В июле OpenAI выпустила Python-подобный язык программирования Triton для разработки нейросетей.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK