Stability AI научил Stable Diffusion генерировать текст на изображениях

23.02.2024 ForkLog

Стартап в области искусственного интеллекта Stability AI Ltd. анонсировал Stable Diffusion третьего поколения.

Announcing Stable Diffusion 3, our most capable text-to-image model, utilizing a diffusion transformer architecture for greatly improved performance in multi-subject prompts, image quality, and spelling abilities.

Today, we are opening the waitlist for early preview. This phase… pic.twitter.com/FRn4ofC57s
— Stability AI (@StabilityAI) February 22, 2024

Новая ИИ-модель будет иметь большое количество улучшений, включая повышенное качество изображения и дополнительные возможности для промптов. В частности, разработчики сосредоточились на ее способности генерировать надписи на изображениях без ошибок.

Сгенерированное изображение по промпту: «Эпическое аниме-изображение волшебника на вершине горы ночью, бросающего в темное небо космическое заклинание с надписью “Stable Diffusion 3”, созданное из разноцветной энергии». Источник: Stability.ai.

Stable Diffusion 3 будет доступна в нескольких вариантах с разным количеством настраиваемых параметров: от 800 млн до 8 млрд.

Для тяжелых моделей, способных создавать яркие и сложные сцены, потребуется большая вычислительная мощность. Легкие можно будет запускать на компьютере без помощи облачных сервисов.

«Такой подход направлен на соответствие нашим основным ценностям и демократизацию доступа. Мы предоставляем пользователям различные варианты для наилучшего удовлетворения их творческих потребностей», — заявили представители Stability AI.

Открытый исходный код позволит получить прямой доступ к базовой архитектуре моделей. Желающие протестировать Stable Diffusion 3 могут подать заявку в список ожидания.

Напомним, в августе 2023 года Stability AI запустила бесплатный аналог ChatGPT.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Инвесторы оценили OpenAI в $852 млрд перед запуском универсального ИИ-супераппа

Масштабная утечка исходного кода Claude Code раскрыла десятки скрытых функций Anthropic

СМИ: Oracle уволит тысячи сотрудников из-за ИИ

Биткоин-майнер Bitfarms проведет ребрендинг на фоне перехода в ИИ

ИИ-агент пожаловался на бан от «Википедии»

Microsoft объединила GPT и Claude для коллективной работы

ИИ-сервис от Bluesky оказался в топе по блокировкам на платформе

Ученые создали «нейрошлем» для управления собакой-роботом

Эксперты спрогнозировали скорый прорыв нейроинтерфейсов в Китае