#Искусственный Интеллект #Культура и искусство

Энтузиаст задействовал нейросеть Stable Diffusion для обработки селфи

17.10.2022 nts

Немецкий энтузиаст Фабиан Штельцер использовал онлайн-инструменты на базе популярной нейросети Stable Diffusion для обработки своих селфи в разных стилях. Он популяризировал подобные алгоритмические системы и сделал их вирусными, пишет Motherboard.

Штельцер задействовал программы, которые несколько раз вносят пользовательские настройки в генератор изображений по тексту.

AI selfies: custom tuned #stablediffusion embeddings that let you generate flattering images of yourself in any context and style — #nofilter 😅

this already works with just ~5 ref images 🤯

Me at Woodstock, seemingly under the influence: pic.twitter.com/4CQtTamnYn
— fabian (@fabianstelzer) October 11, 2022

Он создал селфи в различных стилях живописи, жанрах фильмов и по своим задумкам вроде фото из «Вудстока» или в образе женщины.

AI custom trained #stablediffusion selfies: me as a woman — this basically seems to create a 100x prettified male version of myself 50% of times though pic.twitter.com/M0DGsGBTiD
— fabian (@fabianstelzer) October 11, 2022

Stable Diffusion от стартапа Stability AI — одна из многих ИИ-систем, генерирующая изображения по запросу. Разработчики обучили алгоритм на миллиардах аннотированных и размеченных картинок.

Нейросеть можно натренировать ассоциировать конкретные слова и фразы с определенными типами изображений, эстетикой, местами или объектами. Благодаря этому появились веб-сайты, позволяющие пользователям «регулировать» модель и добавлять собственные встраивания.

Создатели сервиса drawanyone утверждают, что их инструмент способен обработать фото по пяти исходным снимкам всего за час. Несколько человек продемонстрировали свои ИИ-селфи в треде под постом Штельцера.

Crazy accuracy 😤 this what I got using 20 images and 2020 steps pic.twitter.com/0AUewaPWG7
— Vince Buyssens (@voidwalker_com) October 11, 2022

По словам энтузиаста, его поразило качество работы системы, так как потребовалось всего несколько эталонных изображений для «внедрения себя» в модель.

«Загруженные мной селфи, возможно, немного одинаковые, поэтому я буду заново тренировать инструмент на более разнообразном наборе поз и выражений», — сказал он.

AI selfies with a custom #stablediffusion embedding, me in in @SALT_VERSE, Bladerunner, Wes Anderson, 1950s Rock'n'Roll Drama pic.twitter.com/iIhHFe8nw9
— fabian (@fabianstelzer) October 11, 2022

Штельцер также занимается другими ИИ-проектами, включая разработку полнометражного мультисюжетного фильма «Соль». Он задействует алгоритмы вроде Stable Diffusion, Midjourney и DALL-E 2 для создания кадров и модели генерации звука, включая Synthesia и Murf. За написание сценария отвечает нейросеть GPT-3.

По мере появления каждого фрагмента фильма зрители могут проголосовать за один из вариантов продолжения.

«[ИИ-системы] по крайней мере, так же велики, как открытие фотографии или кино, а если мы включим языковые модели вроде GPT-3, то, вероятно, это можно сравнить с изобретением печатного станка. Влияние на средства массовой информации, культуру и ткань реальности станет довольно глубоким», — заявил Штельцер.

Энтузиаст отметил, что принятое Stability AI решение о публикации исходного кода сделает алгоритм безопаснее закрытых корпоративных проектов.

«Такими системами тоже пользуются злоумышленники. Однако с подобными проектами работают меньше пользователей, способных грамотно задействовать инструмент», — добавил он.

Напомним, в октябре энтузиаст задействовал Stable Diffusion для создания постоянно меняющихся виртуальных миров.

В том же месяце ИИ-исследователь научил нейросеть превращать «кого угодно» в покемонов.

В августе Stability AI предоставила более 1000 разработчикам доступ к генератору изображений по тексту Stable Diffusion, а позже открыла его для широкой аудитории.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

В Китае стала популярна платная услуга удаления OpenClaw

Nvidia запланировала запуск инфраструктуры для дата-центров в космосе

Messari сменила CEO и уволила часть команды

Китай впервые одобрил коммерческое применение нейроимпланта

Киберцентр Китая предупредил о связанных с OpenClaw рисках на фоне бума в стране

Perplexity представила конкурента OpenClaw — Personal Computer

Исследование подтвердило рост рабочей нагрузки после массового внедрения ИИ

Бум ИИ лишил криптоиндустрию больше половины активных разработчиков

Высечь в камне