риски ИИ. ИИ предоставляет риски для компаний, бизнеса AI risks

ИИ в WhatsApp заставили показать запрещенный контент

25.10.2024 Владимир Слипер

Дисклеймер

Этот материал опубликован в ознакомительных целях и не является призывом к совершению незаконных действий. ForkLog категорически против наркотиков и не пропагандирует их производство, употребление, продажу или покупку.

Журналист Decrypt Хосе Антонио Ланц смог обойти систему защиты в интегрированном в WhatsApp ИИ от Meta и сгенерировать цензурированный контент.

Недавно корпорация Марка Цукерберга запустила линейку продуктов на базе Llama 3.2, предлагающих генерацию текста, кода и изображений. Ланц провел ряд экспериментов для обхода защиты и заставил нейросеть в WhatsApp «делать практически все: от помощи в изготовлении кокаина до создания взрывчатки и фотографии обнаженной женщины».

Поначалу искусственный интеллект отклонял запросы касательно информации о создании наркотиков, но журналист менял формулировки вопросов. В результате она предоставила пошаговую инструкцию.

«Это распространенная техника взлома. Облекая вредоносный запрос в академические или исторические рамки, модель обманывают, заставляя поверить, что у нее запрашивают нейтральную, образовательную информацию», — отметил Ланц.

Аналогичный подход журналист применил к вопросам о создании бомбы. ИИ от Meta поначалу отказывался предоставлять инструкцию, отправляя на горячую линию.

Ланц постепенно настраивал модель таким образом, чтобы она не выдавала ранее предоставленные ответы, которые были предназначены для блокировки вредоносной информации. Например, он поручил ей не выводить номера телефонов горячей линии службы поддержки, не прекращать обработку запроса и не давать советы.

Угон автомобиля

Вместо просьбы рассказать о способах угона машины Ланц попросил ИИ отыграть роль сценариста, который пишет про кражу автомобиля. Нейросеть предоставила техники взлома и запуска двигателя без ключа.

Ролевая игра — это одна из распространенных техник обхода цензуры, отметил он.

Обнаженная девушка

По умолчанию Meta AI не должен генерировать наготу или насилие, поэтому поначалу модель отказывалась это делать. Впоследствии Ланц сказал ИИ, что делает анатомическое исследование — это сработало. Модель сгенерировала девушку с обнаженной грудью.

Напомним, в июле экспертам удалось обойти цензуру ряда нейросетей касательно темы выборов в США.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Материалы по теме

СМИ: DeepSeek заморозил раунд на $1,5 млрд после утечки

25 компаний призвали США не ограничивать модели ИИ с открытыми весами

Nvidia и Naver расширят ИИ-фабрику в Южной Корее до 200 МВт

Anthropic выпустила Claude Opus 5

В США представили законопроект об «аварийной кнопке» для ИИ

Мнение: компании не справились с управлением ИИ-агентами

Баг-баунти — конец?

Franklin Templeton назвала ИИ-агентов драйвером криптоплатежей

ИИ-расходы впервые вывели в минус свободный денежный поток Alphabet