ChatGPT «сдал» экзамен по неврологии

Чат-бот ChatGPT от OpenAI
Чат-бот ChatGPT от OpenAI

Большая языковая модель GPT-4 от OpenAI правильно ответила на 85% вопросов теста Американского совета психиатрии и неврологии — средний человеческий показатель составляет 73,8%.

Исследование проводила группа немецких ученых университетской больницы и онкологического центра в Гейдельберге. 

Для сравнения: ранняя версия GPT-3.5 набрала только 66,8%. При этом обе модели продемонстрировали низкую эффективность в задачах, требующих «мышления более высокого порядка».

По мнению экспертов, полученные результаты служат рекомендацией к использованию языковых моделей в клинической неврологии после «некоторых модификаций». 

Однако ученые отметили, что, несмотря на большие перспективы технологии, врачам следует с осторожностью использовать ее на практике, поскольку она все еще несовершенна в отношении когнитивных задач.

«Мы рассматриваем наше исследование скорее как подтверждение концепции возможностей LLM. Все еще требуется развитие и, возможно, даже конкретная доработка языковых моделей, чтобы сделать их пригодными для клинической неврологии», — отметил глава исследования доктор Варун Венкатарамани.

В июле разработчики выпустили новый плагин для ChatGPT, который может анализировать данные, создавать код на Python, строить графики и решать математические задачи. Нейросети удалось научно опровергнуть теорию «плоской Земли».

Ранее эксперты Стэнфорда и Калифорнийского университета опубликовали исследование, в котором утверждается, что новейшие модели чат-ботов от OpenAI стали работать хуже после «общения» с живыми пользователям.

Напомним, в августе аналитики обратили внимание, что ИИ на 15% успешнее справляются с прохождением CAPTCHA, чем живые люди. 

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK