Стартап представил генератор видео-дикторов по одному фото

Израильский ИИ-стартап D-ID запустил платформу Creative Reality Studio для создания видео с диктором по одному изображению.

Пользователям необходимо загрузить фотографию докладчика или выбрать один из доступных вариантов. Затем они могут вставить текст, который требуется озвучить, или отправить готовую аудиодорожку с речью.

Разработчики заявили, что платформа поддерживает работу со 119 языками. Пользователи могут настраивать голос, а также задавать его настроение.

На основе заданных параметров алгоритмы Creative Reality Studio генерируют видео, на котором синтезированный диктор реалистично прочитает указанный текст.

По словам разработчиков, время генерирования видео составляет половину длительности ролика. Однако во время тестирования технологии журналисты заметили, что создание 60-секундного выступления заняло несколько минут.

В компании уверены, что их сервис будет востребован в таких секторах, как корпоративное обучение и образование, внутренние и внешние коммуникации, маркетинг и продажи.

«Мы используем наш ИИ для создания ведущих и наставников, которые воспроизводят людей и делают контент более привлекательным и эффективным», — сказал генеральный директор D-ID Гил Перри.

Во избежание создания дипфейков разработчики установили ряд ограничений. Пользователи не могут загружать ругательства и расистские высказывания, а также фото известных людей. Правила платформы запрещают создавать и видеоролики политического содержания.

В случае несоблюдения условий использования компания может приостановить действие учетной записи нарушителя и удалить его видео из библиотеки.

Для новых аккаунтов доступна 14-дневная пробная версия. По истечении двух недель пользователи могут оформить подписку за $49 в месяц и генерировать FullHD-ролики общей длительностью в 15 минут.

Напомним, в марте 2022 года D-ID и MyHeritage научили фотографии разговаривать.

В октябре 2021 года израильский стартап разработал инструмент Speaking Portraits, который оживляет человека на портретном снимке.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK
Exit mobile version