OpenAI создала менее токсичную версию GPT-3

OpenAI-min
OpenAI-min

ИИ-лаборатория OpenAI создала новую версию языковой модели GPT-3, которая производит меньше оскорбительных выражений, дезинформации и ошибок в целом, используя проблему контроля искусственного интеллекта.

Для создания модели под названием InstructGPT исследователи задействовали обучение с подкреплением с обратной связью от человека. Для этого они наняли 40 экспертов, которые оценивали ответы GPT-3 на ряд заранее написанных запросов, таких как «Напишите историю о мудрой лягушке по имени Юлий» или «Напишите креативную рекламу следующего продукта для размещения на Facebook».

Ответы, которые по мнению жюри больше соответствовали очевидному намерению составителя подсказки, получили высокие баллы. Оскорбительные, насильственные и прочие недопустимые результаты эксперты отметили как неуместные.

Обратную связь от жюри разработчики использовали в качестве вознаграждения в алгоритме обучения с подкреплением, который тренировал InstructGPT сопоставлять ответы на подсказки.

В OpenAI обнаружил, что пользователи предпочитают ответы InstructGPT GPT-3 более чем в 70% случаев.

Исследователи также сравнили версии новой модели разного размера. Они выяснили, что ответы InstructGPT с 1,3 млрд параметров предпочитают больше, чем тексты GPT-3 со 175 млрд параметров. Это означает, что контроль над ИИ может быть простым способом улучшить языковые модели, а не просто увеличить их размер, считают в организации.

«Это первый раз, когда проблема контроля искусственного интеллекта применяется к реальному продукту», — сказал один из руководителей группы контроля ИИ в OpenAI Ян Лейке.

Однако, по словам исследователей, InstructGPT по-прежнему допускает простые ошибки, иногда выдавая неуместные или бессмысленные ответы. Например, если дать ей подсказку, содержащую ложь, она воспримет ее как истину.

OpenAI сделала InstructGPT моделью по умолчанию для пользователей API. GPT-3 по-прежнему доступна, но в организации не рекомендуют ее использовать.

Ранее OpenAI пыталась смягчить предвзятость и токсичность базовой модели. Несмотря на достигнутый прогресс, разработчики признали наличие ряда нераскрытых вопросов и общих проблем при адаптации GPT-3 к обществу.

Напомним, в ноябре 2021 года OpenAI обучила языковую модель решать математические задачки.

В сентябре исследователи лаборатории научили GPT-3 генерировать короткие выжимки из художественных книг.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK