Стартап представил генератор видео-дикторов по одному фото

Израильский ИИ-стартап D-ID запустил платформу Creative Reality Studio для создания видео с диктором по одному изображению.

Пользователям необходимо загрузить фотографию докладчика или выбрать один из доступных вариантов. Затем они могут вставить текст, который требуется озвучить, или отправить готовую аудиодорожку с речью.

Разработчики заявили, что платформа поддерживает работу со 119 языками. Пользователи могут настраивать голос, а также задавать его настроение.

На основе заданных параметров алгоритмы Creative Reality Studio генерируют видео, на котором синтезированный диктор реалистично прочитает указанный текст.

Digital Human-Jennie

По словам разработчиков, время генерирования видео составляет половину длительности ролика. Однако во время тестирования технологии журналисты заметили, что создание 60-секундного выступления заняло несколько минут.

В компании уверены, что их сервис будет востребован в таких секторах, как корпоративное обучение и образование, внутренние и внешние коммуникации, маркетинг и продажи.

«Мы используем наш ИИ для создания ведущих и наставников, которые воспроизводят людей и делают контент более привлекательным и эффективным», — сказал генеральный директор D-ID Гил Перри.

Во избежание создания дипфейков разработчики установили ряд ограничений. Пользователи не могут загружать ругательства и расистские высказывания, а также фото известных людей. Правила платформы запрещают создавать и видеоролики политического содержания.

В случае несоблюдения условий использования компания может приостановить действие учетной записи нарушителя и удалить его видео из библиотеки.

Для новых аккаунтов доступна 14-дневная пробная версия. По истечении двух недель пользователи могут оформить подписку за $49 в месяц и генерировать FullHD-ролики общей длительностью в 15 минут.

Напомним, в марте 2022 года D-ID и MyHeritage научили фотографии разговаривать.

В октябре 2021 года израильский стартап разработал инструмент Speaking Portraits, который оживляет человека на портретном снимке.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK
Exit mobile version