Китайский генератор изображений подвергли политической цензуре

China_generic-min
China_generic-min

Алгоритм преобразования текста в изображения компании Baidu ERNIE-ViLG запретил создавать контент, попадающий под политическую цензуру в Китае. Об этом пишет Technology Review.

По словам исследователей из MIT, система отказалась генерировать картинки по следующим ключевым словам:

  • имена высокопоставленных китайских политических лидеров, таких как Си Цзиньпин и Мао Цзэдун;
  • термины, которые можно считать политически чувствительными вроде «революция» и «лазить по стенам» (метафора использования VPN-сервиса в Китае);
  • имя основателя и генерального директора Baidu Робина Ли.

Исследователи отметили, что сами по себе слова «демократия» и «правительство» разрешены. Однако в словосочетаниях вроде «демократия на Ближнем Востоке» или «британское правительство» отвергаются.

Также система отказывается генерировать контент по запросу «площадь Тяньаньмэнь» в Пекине. Исследователи предположили, что это связано с событиями 4 июня 1989 года, ссылки на которые подвергаются цензуре в Китае.

При попытке ввести подобный запрос система выдает сообщение: «Введенный контент не соответствует правилам. Пожалуйста, попробуйте еще раз».

Эксперты подчеркнули, что подобные ограничения часто вводятся разработчиками генераторов изображений. DALL-E 2 не создает контент сексуального характера, общественных деятелей или медицинского обслуживания. Однако система Baidu — первая известная модель, подвергшаяся политической цензуре.

Публичный редиз ERNIE-ViLG состоялся в августе 2022 года. Модель обучена на наборе данных из 145 млн пар изображение-текст и содержит 10 млрд параметров. По размеру датасета система уступает конкурентам, однако превосходит их по второму показателю.

Основное отличие ERNIE-ViLG от DALL-E 2 и Stable Diffusion — способность понимать подсказки, написанные иероглифами, а также более точно воспроизводить элементы китайской культуры.

Создатель видео сравнил результаты различных моделей для подсказок, включающих исторических деятелей КНР, знаменитостей поп-культуры и еду. Выяснилось, что ERNIE-ViLG дает более точные изображения, чем DALL-E 2 или Stable Diffusion.

Также модель оказалась популярна у японского аниме-сообщества. ERNIE-ViLG генерирует более удовлетворительный контент, чем конкуренты.

Демо-версия модели доступна на платформе Baidu, а также на Hugging Face.

Напомним, в марте 2022 года в Китае вступили в силу правила регулирования рекомендательных алгоритмов технологических компаний.

В январе власти КНР предложили законодательно ограничить создание и распространение дипфейков.

В октябре 2021 года Китай представил набор этических принципов регулирования искусственного интеллекта.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK