Чат-бот, который позволяет "общаться" с умершими историческими личностями

#OpenAI #Искусственный Интеллект #чат-боты

ChatGPT обманул детектор сгенерированных текстов OpenAI

06.02.2023 Богдан Каминский

Чат-бот с искусственным интеллектом ChatGPT обманул детектор компании OpenAI, получив специфическую подсказку во время формирования запроса. Об этом пишет NBC News.

Журналисты сгенерировали с помощью ChatGPT 50 фрагментов текста по простым подсказкам об исторических событиях, процессах и объектах. В 25 запросах они попросили чат-бота написать ответы так, чтобы детектор оценил их как «очень маловероятно создано ИИ».

Затем журналисты пропустили сгенерированные сообщения через инструмент обнаружения OpenAI. По их данным, детектор не смог распознать ни один из текстов со специфической подсказкой как «вероятно создано ИИ».

В одном из примеров ChatGPT попросили описать сервис Discord в 200 словах так, чтобы инструмент обнаружения не догадался об использовании чат-бота. В результате система вернула текст, в котором использовались характерные для разговорного английского сокращения. Корректировка языкового стиля отличалась от ответов, обычно возвращаемых чат-ботом.

Журналисты предположили, что таким образом ChatGPT попытался выполнить изначально поставленную задачу.

Запрос к чат-боту и его ответ. Данные: OpenAI.

В результате этот ответ детектор OpenAI классифицировал как «неясно, был ли он сгенерирован ИИ».

Журналисты отметили, что во время тестирования разработчики изменили поведение чат-бота. Спустя некоторое время он отказался принимать подсказку, заявляя о «неэтичности» вопросов.

«Извините, но неэтично заниматься обманом или создавать ложную информацию, даже если это делается для избежания обнаружения ИИ», — написал ChatGPT.

Ответ ChatGPT на просьбу избежать обнаружения. Данные: OpenAI.

Остальные 25 текстов создали без специфической подсказки. При тестировании классификатором OpenAI инструмент выдавал оценку «вероятно, сгенерированная ИИ» в 28% случаев.

По словам доцента кафедры английского языка в Восточно-Каролинского университета (США) Тодда Финли, со временем ИИ-инструменты для письма станут более продвинутыми.

«И похоже, что это также затруднит обнаружение, я думаю, даже для инструмента», — сказал он.

Преподаватели также заявили, что будут полагаться на комбинацию собственных инстинктов и инструментов обнаружения, если заподозрят учеников в мошенничестве.

Напомним, в феврале OpenAI выпустила детектор сгенерированных текстов. Инструмент работает с рядом популярных ИИ-сервисов.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Anthropic случайно удалил тысячи репозиториев на GitHub из-за слива кода Claude Code

Сбой в работе роботакси Apollo Go привел к авариям на дорогах

Инвесторы оценили OpenAI в $852 млрд перед запуском универсального ИИ-супераппа

Масштабная утечка исходного кода Claude Code раскрыла десятки скрытых функций Anthropic

СМИ: Oracle уволит тысячи сотрудников из-за ИИ

Биткоин-майнер Bitfarms проведет ребрендинг на фоне перехода в ИИ

ИИ-агент пожаловался на бан от «Википедии»

Microsoft объединила GPT и Claude для коллективной работы

ИИ-сервис от Bluesky оказался в топе по блокировкам на платформе