Энтузиаст задействовал нейросеть Stable Diffusion для обработки селфи

Немецкий энтузиаст Фабиан Штельцер использовал онлайн-инструменты на базе популярной нейросети Stable Diffusion для обработки своих селфи в разных стилях. Он популяризировал подобные алгоритмические системы и сделал их вирусными, пишет Motherboard.

Штельцер задействовал программы, которые несколько раз вносят пользовательские настройки в генератор изображений по тексту.

https://twitter.com/fabianstelzer/status/1579818101134106626

Он создал селфи в различных стилях живописи, жанрах фильмов и по своим задумкам вроде фото из «Вудстока» или в образе женщины.

Stable Diffusion от стартапа Stability AI — одна из многих ИИ-систем, генерирующая изображения по запросу. Разработчики обучили алгоритм на миллиардах аннотированных и размеченных картинок. 

Нейросеть можно натренировать ассоциировать конкретные слова и фразы с определенными типами изображений, эстетикой, местами или объектами. Благодаря этому появились веб-сайты, позволяющие пользователям «регулировать» модель и добавлять собственные встраивания.

Создатели сервиса drawanyone утверждают, что их инструмент способен обработать фото по пяти исходным снимкам всего за час. Несколько человек продемонстрировали свои ИИ-селфи в треде под постом Штельцера.

https://twitter.com/voidwalker_com/status/1579841554298331141

По словам энтузиаста, его поразило качество работы системы, так как потребовалось всего несколько эталонных изображений для «внедрения себя» в модель.

«Загруженные мной селфи, возможно, немного одинаковые, поэтому я буду заново тренировать инструмент на более разнообразном наборе поз и выражений», — сказал он.

Штельцер также занимается другими ИИ-проектами, включая разработку полнометражного мультисюжетного фильма «Соль». Он задействует алгоритмы вроде Stable Diffusion, Midjourney и DALL-E 2 для создания кадров и модели генерации звука, включая Synthesia и Murf. За написание сценария отвечает нейросеть GPT-3.

По мере появления каждого фрагмента фильма зрители могут проголосовать за один из вариантов продолжения.

«[ИИ-системы] по крайней мере, так же велики, как открытие фотографии или кино, а если мы включим языковые модели вроде GPT-3, то, вероятно, это можно сравнить с изобретением печатного станка. Влияние на средства массовой информации, культуру и ткань реальности станет довольно глубоким», — заявил Штельцер.

Энтузиаст отметил, что принятое Stability AI решение о публикации исходного кода сделает алгоритм безопаснее закрытых корпоративных проектов.

«Такими системами тоже пользуются злоумышленники. Однако с подобными проектами работают меньше пользователей, способных грамотно задействовать инструмент», — добавил он.

Напомним, в октябре энтузиаст задействовал Stable Diffusion для создания постоянно меняющихся виртуальных миров.

В том же месяце ИИ-исследователь научил нейросеть превращать «кого угодно» в покемонов.

В августе Stability AI предоставила более 1000 разработчикам доступ к генератору изображений по тексту Stable Diffusion, а позже открыла его для широкой аудитории.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK