OpenAI обновила генератор изображений по текстовому описанию DALL-E

07.04.2022 Богдан Каминский

Некоммерческая организация OpenAI представил новую версию генератора изображений по текстовому описанию, создающего реалистичные картинки в более высоком разрешении и с меньшей задержкой, чем оригинал.

Our newest system DALL·E 2 can create realistic images and art from a description in natural language. See it here: https://t.co/Kmjko82YO5 pic.twitter.com/QEh9kWUE8A
— OpenAI (@OpenAI) April 6, 2022

В DALL-E 2 пользователи могут выбирать и редактировать определенные области существующих изображений, добавлять или удалять элементы вместе с их тенями, создавать коллажи и вариации готовых рисунков.

Нейросеть генерирует картинки с разрешением 1024 пикселя — в четыре раза выше, чем у оригинальной модели.

Изображения, созданные DALL-E 2. Данные: OpenAI.

Сервис DALL-E (сочетание имен художника Сальвадора Дали и мультипликационного персонажа ВАЛЛ-И) основан на модели компьютерного зрения OpenAI CLIP, анонсированной в 2021 году.

«Оригинальная модель просто брала подход GPT-3 из языка и применяла его для создания изображения: мы помещали изображения в набор слов и научились предсказывать, что будет дальше», — рассказал исследователь OpenAI Прафулла Дхаривал.

На сегодня DALL-E 2 доступна тестировщикам, зарегистрировавшимся в листе ожидания. Пользователям недоступно создание непристойных и экстремистских изображений, а также материалов, связанных с «текущими геополитическими событиями».

Напомним, в январе инженер машинного обучения создал генератор покемонов на основе модели DALL-E.

В августе 2021 года энтузиаст разработал уменьшенную версию генератора рисунков из текстового описания от OpenAI.

Подписывайтесь на ForkLog в TikTok!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Google выпустила семейство открытых моделей Gemma 4

Парализованный пациент создал музыку с помощью нейроинтерфейса

Google выпустила доступный ИИ-видеогенератор Veo 3.1 Lite

Anthropic случайно удалил тысячи репозиториев на GitHub из-за слива кода Claude Code

Сбой в работе роботакси Apollo Go привел к авариям на дорогах

Инвесторы оценили OpenAI в $852 млрд перед запуском универсального ИИ-супераппа

Масштабная утечка исходного кода Claude Code раскрыла десятки скрытых функций Anthropic

СМИ: Oracle уволит тысячи сотрудников из-за ИИ

Биткоин-майнер Bitfarms проведет ребрендинг на фоне перехода в ИИ