OpenAI обновила генератор изображений по текстовому описанию DALL-E
Некоммерческая организация OpenAI представил новую версию генератора изображений по текстовому описанию, создающего реалистичные картинки в более высоком разрешении и с меньшей задержкой, чем оригинал.
Our newest system DALL·E 2 can create realistic images and art from a description in natural language. See it here: https://t.co/Kmjko82YO5 pic.twitter.com/QEh9kWUE8A
— OpenAI (@OpenAI) April 6, 2022
В DALL-E 2 пользователи могут выбирать и редактировать определенные области существующих изображений, добавлять или удалять элементы вместе с их тенями, создавать коллажи и вариации готовых рисунков.
Нейросеть генерирует картинки с разрешением 1024 пикселя — в четыре раза выше, чем у оригинальной модели.
Сервис DALL-E (сочетание имен художника Сальвадора Дали и мультипликационного персонажа ВАЛЛ-И) основан на модели компьютерного зрения OpenAI CLIP, анонсированной в 2021 году.
«Оригинальная модель просто брала подход GPT-3 из языка и применяла его для создания изображения: мы помещали изображения в набор слов и научились предсказывать, что будет дальше», — рассказал исследователь OpenAI Прафулла Дхаривал.
На сегодня DALL-E 2 доступна тестировщикам, зарегистрировавшимся в листе ожидания. Пользователям недоступно создание непристойных и экстремистских изображений, а также материалов, связанных с «текущими геополитическими событиями».
Напомним, в январе инженер машинного обучения создал генератор покемонов на основе модели DALL-E.
В августе 2021 года энтузиаст разработал уменьшенную версию генератора рисунков из текстового описания от OpenAI.
Подписывайтесь на ForkLog в TikTok!
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!