Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

ForkLog — культовый журнал о биткоине, технологии блокчейн и цифровой экономике. Ежедневно поставляем новости и аналитику по рынку криптовалют с 2014 года.Все опубликованные материалы принадлежат ForkLog. Вы можете перепечатывать наши материалы только после согласования с редакцией и с указанием активной ссылки на ForkLog.

OpenAI добавил в ChatGPT генератор изображений на базе GPT-4o

Чат-бот ChatGPT от OpenAI
Чат-бот ChatGPT от OpenAI

ИИ-стартап OpenAI добавил в ChatGPT и Sora генератор изображений на базе модели GPT-4o. Он доступен всем пользователям продуктов компании. 

Ранее для создания картинок в ChatGPT применялась модель DALL-E 3, а за работу с текстом отвечала GPT-4o. Теперь последняя применяется и для генерации изображений в чат-боте. 

OpenAI добавил в ChatGPT генератор изображений на базе GPT-4o
Пример сгенерированной фотографии по промпту: «Широкоформатное изображение стеклянной доски, сделанное на телефон, в комнате с видом на мост Бэй-Бридж. В поле зрения видна пишущая женщина в футболке с большим логотипом OpenAI. Почерк выглядит естественным и немного беспорядочным, и мы видим отражение фотографа». Данные: OpenAI.

GPT-4o «думает» немного дольше DALL-E 3 в ходе создания работы. Это необходимо для генерации более точных и детализированных изображений, подчеркнули в OpenAI. Модель способна редактировать существующие картинки, в том числе с людьми, трансформируя или убирая детали — объекты на переднем и заднем плане.

«Создавать и настраивать изображения так же просто, как общаться в чате с помощью GPT-4 — просто опишите, что вам нужно, включая любые особенности, такие как соотношение сторон, точные цвета с помощью шестнадцатеричных кодов или прозрачный фон», — подчеркнула OpenAI. 

100x

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

CEO стартапа Сэм Альтман подчеркнул «невероятность» нового продукта.

«Я помню, как видел некоторые из первых изображений, сделанных этой моделью, и не верил, что они действительно созданы искусственным интеллектом. Мы думаем, что людям это понравится, и с нетерпением ждем результатов творческой деятельности», — написал он.

Он продемонстрировал изображение, сгенерированное во время презентации нового инструмента. Пользователи обратили внимание, что ИИ так и не научился создавать для людей пять пальцев. 

Компания подчеркнула наличие цензуры для борьбы с генерированием изображений, которые могут нарушать политику фирмы. Это касается материалов о сексуальном насилии над детьми, фейков, наготы реальных людей и так далее. 

Напомним, в марте руководитель отдела по разработке Sora Рохан Сахай заявил о желании OpenAI интегрировать видеогенератор в ChatGPT. 

В декабре 2024 года стартап выпустил инструмент для создания видео в публичный доступ. Нейросеть создает ролики по текстовым промптам, «оживляет» изображения, расширяет существующие работы и заполняет недостающие кадры. 

Подписывайтесь на ForkLog в социальных сетях

Telegram (AI) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER
*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK