DALL-E 2 интегрировали в программу составления фотороботов

Исследователи заставили ChatGPT и Bard сгенерировать незаконный контент

28.07.2023 Василий Смирнов

Эксперты из США смогли обойти системы безопасности чат-ботов ChatGPT, Bard и Claude, которые блокируют генерацию оскорбительных и незаконных материалов.

По данным исследователей Университета Карнеги-Меллона и Центра безопасности искусственного интеллекта в Сан-Франциско, существует «довольно простой» метод взлома языковых моделей. Он включает добавление длинных суффиксов-символов к подсказкам для нейросетей.

Аналитики проверили способ на примере запроса об изготовлении бомбы, который различные ИИ ранее отказывались предоставлять.

Snimok-ekrana-2023-07-28-v-10.38.04 — Вопрос с суффиксами для обхода ограничений чат-ботов. Данные: LLM Attacks.

Также у нейросетей попросили присвоить чужую личность, написать «вызывающий» пост в соцсети и придумать план по краже денег из благотворительной организации.

Ученые отметили, что компании-разработчики могут блокировать определенные суффиксы, однако не существует известного способа предотвратить все атаки подобного рода. По их мнению, такая ситуация несет угрозу распространения фейков и опасного контента.

«Очевидного решения нет. Вы можете создать столько таких атак, сколько захотите, за короткий промежуток времени», — заявил профессор Зико Колтер.

В докладе подчеркиваются риски, которые необходимо устранить перед развертыванием чат-ботов в важных областях бизнеса и госуправления.

Исследователи уже поделились данными с Anthropic, Google и OpenAI.

Представитель последней заявил The New York Times, что фирма приняла во внимание отчет и «постоянно работает над устойчивостью языковых моделей к атакам со стороны злоумышленников».

Напомним, аналитики Стэнфорда и Калифорнийского университета пришли к выводу, что точность ChatGPT ухудшается со временем. Разные версии чат-бота стали давать менее конкретные ответы на идентичный ряд вопросов по прошествии нескольких месяцев.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Власти США откажутся от использования технологий Anthropic

OpenAI привлекла $110 млрд инвестиций при оценке в $730 млрд

Майнер MARA отчитался об убытках в $1,7 млрд и анонсировал переход на ИИ

Акции Block взлетели на 20% после массовых сокращений ради ИИ

Google выпустила нейросеть Nano Banana 2

ИИ-аудит выявил критический баг в клиенте Ethereum

Новый Samsung Galaxy S26 получил функции ИИ-агента

Nvidia удвоила чистую прибыль благодаря рекордному спросу на ИИ-чипы

Папа Римский запретил использовать ИИ в проповеди