Разработчики научили Midjourney генерировать текст
Компания Midjourney анонсировала новую модель ИИ-инструмента для создания изображений, которая получила возможность генерировать осмысленный текст.
We're now alpha-testing our V6 models Midjourney. Just type /settings and click V6 or add —v 6 after your prompt. Image coherence and prompt understanding are greatly improved. You can draw text and dolphins and there's new upscalers too. Happy holidays everyone!
— Midjourney (@midjourney) December 21, 2023
Согласно сообщению в Discord-канале, Midjourney V6 позиционируется как «капитальный ремонт» и в разы превосходит предшественника, выпущенного в марте этого года.
«Более точное следование рекомендациями, а также длинные подсказки, улучшенная связность и знания модели», — описали новую версию нейросети разработчики.
Одним из наиболее важных компонентов V6 является возможность генерации осмысленного текста, а не набора символов, как это было раньше. Однако разработчики отметили, что это не самый центральный элемент модели.
Благодаря улучшениям Midjourney теперь может составить конкуренцию ведущим генеративным моделям вроде DALL-E 3 и Ideogram.
Из-за новых возможностей шестая версия ИИ стала слегка медленней и дороже, но разработчики пообещали поработать над ее производительностью в будущем.
Midjourney V6, обученная с нуля на суперкластерах ИИ, также может похвастаться улучшенными модулями масштабирования в «тонком» и «творческом» режимах, повышающими разрешение изображения в два раза.
Альфа-версия нейросети поддерживает несколько новых аргументов, включая «-ar» для изменения разрешения, «-chaos» для выбора вариаций генерации изображений, «-stylize» для изменения творческого стиля (чем меньше значение, тем быстрее нейросеть выдаст результат, жертвуя детализацией).
«Вам придется заново научиться подсказывать», — предупредила команда проекта.
Другие функции вроде зума и панорамирования появятся во время релиза модели.
Пока поучаствовать в тестирования Midjourney V6 можно на Discord-сервере, отправляя желаемый запрос в чат.
«Команда проекта включила системы модерации и будет обеспечивать соблюдение стандартов нашего сообщества с повышенной строгостью. Не будьте придурками и не создавайте образы, которые провоцируют драму», — подчеркнули разработчики.
Пользователи уже начали делится полученными результатами.
Midjourney V6 …. We have TEXT!
— Orcton (@OrctonAI) December 21, 2023
It can be hit or miss but still learning how it works.
These 4 were all from one generation.
Maybe got lucky 🤷♂️
Prompt in image 1 ALT#midjourneyV6 #MJV6 #AIart #aiartcommunity #digitalart #midjouney #MidjourneyAI #AIArtwork pic.twitter.com/BIJwr49489
Большинство отмечает высокую степень детализации у созданных изображений даже без апскейла.
Midjourney V6 is looking mighty tasty!
— GifCo (@giffboake) December 20, 2023
Huge increase in detail at the same resolution.
These are NOT final model images and are not upscaled.#midjouney #AIArtCommuity pic.twitter.com/SJYK6v7LyC
Для демонстрации возможностей Midjourney один из пользователей попросил сгенерировать «92-летнего морщинистого злого старика в студийном свете».
Midjourney v1 until v6, same prompt"
— Marco Nedermeijer (@MNedermeijer) December 21, 2023
white background, closeup portrait of a very old mean man, 92 years old, wrinkles, realistic skin, studio lighting,, canon f/4#midjourneyV6 #midjouney #aiartcommunity pic.twitter.com/g8wAALAbH3
Ранее Google представила глобальное обновление для чат-бота Bard, которое призвано расширить возможности нейросети. Апдейт получил название Gemini.
Напомним, в ноябре ИИ-стартап Anthropic анонсировал новую модель Claude 2.1 с увеличенным контекстным окном на 200 000 токенов, эквивалентным 500 страницам текста.
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!