FaceID под экраном, ChatGPT в Microsoft Office и другие новости из мира ИИ

AI_Digest_3
AI_Digest_3

Мы стремимся информировать читателей не только о событиях в биткоин-индустрии, но и рассказывать о том, что происходит в смежных технологических сферах — кибербезопасности и в мире искусственного интеллекта (ИИ).

ForkLog AI собрал наиболее важные новости из мира ИИ за прошедшую неделю.

  • Microsoft внедрит ChatGPT в приложения Office и поисковик Bing.
  • Apple интегрирует датчики FaceID под дисплей в iPhone 16 Pro, согласно СМИ.
  • Amazon уволит 18 000 сотрудников.
  • Tesla выпустила отчет о безопасности автопилота.
  • Microsoft представила имитатор человеческих голосов по короткому образцу VALL-E.
  • Google научила генератор изображений отображать слова на картинках.
  • Энтузиаст с помощью ИИ создал виртуальную «жену».
  • Наиболее важные сделки из области ИИ за последнюю неделю.

Microsoft внедрит ChatGPT в ряд продуктов

Компания Microsoft интегрирует технологию чат-ботов OpenAI в приложения Office.

Пользователи получат возможность добавлять в документы сгенерированный на основе подсказки текст. Кроме того, они смогут использовать ИИ для создания электронных писем с учетом информации, которую необходимо донести до получателя.

Также в марте 2023 года Microsoft планирует добавить ChatGPT в поисковую систему Bing. Ожидается, что технология обеспечит пользователям более понятные, «разговорные» и соответствующие контексту запросов ответы.

СМИ: iPhone 16 Pro оборудуют подэкранным датчиком для FaceID

Компания Apple планирует интегрировать датчики FaceID под дисплей в iPhone 16 Pro.

Текущая система использует инфракрасный датчик TrueDepth для отображения и анализа лица. Это усложняет возможность ее интеграции под дисплей.

Однако, по данным MacRumors, техгигант планирует расширить технологию, включив в процесс обычную селфи-камеру. Ожидается, что модернизация устранит необходимость создания «выреза» в экране смартфона.

Выход Apple iPhone 16 Pro ожидается не ранее 2024 года.

Офисные приложения Google получат улучшенный голосовой ввод

Компания Google улучшит голосовой ввод в «Документах».

По данным техгиганта, обновление уменьшит количество ошибок при транскрипции и минимизирует потерю звука. Функция голосового ввода в «Документах» станет доступна для «большинства основных браузеров».

Кроме того, улучшения получит система автоматического создания подписей в «Презентациях».

До 23 января 2023 года обновление станет доступно клиентам Workspace, G Suite Basic и Business, а также пользователям с личным аккаунтом Google.

Amazon сократит 18 000 человек

Компания Amazon уволит 18 000 сотрудников. По словам главы техгиганта Энди Джесси, сокращения в основном коснутся HR-отдела и электронной коммерции.

Он добавил, что всем уволенным выплатят компенсацию, однако ее размер неизвестен.

Ранее сообщалось о планах Amazon сократить 10 000 человек, в том числе сотрудников подразделения по разработке устройств с голосовым ИИ-помощником Alexa.

Tesla выпустила отчет о безопасности автопилота

Компания Tesla опубликовала ежеквартальные отчеты о безопасности автопилота после длительного перерыва.

По данным производителя, в третьем квартале 2022 года одна авария с участием электрокара с активной функцией Autopilot происходила каждые 10 млн км пробега. Когда водители Tesla не использовали технологию, частота ДТП повышалась до одного случая на 2,74 млн км.

Для сравнения, по данным регуляторов за 2021 год, в США аварии происходят каждые 1 млн км.

В четвертом квартале 2021 года одно ДТП приходилось на 7 млн км пробега. Это означает, что за прошедшее время показатели безаварийности электрокаров с активным автопилотом улучшились.

Microsoft научила ИИ воссоздавать голос по трехсекундному примеру

Компания Microsoft представила имитатор человеческих голосов по короткому образцу VALL-E.

Исследователи обучили ИИ-алгоритм на 60 000 часах речи 7000 англоязычных спикеров. Также они использовали технологию сжатия аудиосигнала EnCodec.

Имитатор человеческих голосов по короткому образцу VALL-E от Microsoft
Схема работы алгоритма VALL-E. Данные: Microsoft.

Инструмент может по 3-секундному образцу клонировать голос человека и озвучить им текст. Также модель способна имитировать эмоции и тон спикера даже при воспроизведении ранее не использованных им слов.

Microsoft не открыла исходный код VALL-E из-за опасений злонамеренного использования технологии.

Генератор изображений Google научился создавать цельные слова

Компания Google представила генератор изображений по тексту Muse. Согласно анонсу, алгоритм качественнее аналогов отображает слова и концепции на картинках.

Демонстрация генерирования изображения с текстом с помощью Muse
Демонстрация генерирования изображения с текстом с помощью Muse. Данные: Google.

Система представляет собой нейросеть-трансформер и базируется на многозадачной языковой модели T5 от Google. Она использует методы сжатого дискретного скрытого пространства и параллельного декодирования.

В компании заявили, что Muse способна генерировать иллюстрации размером 512×512 пикселей за 1,3 секунды. Это превышает скорость создания картинок ИИ-алгоритмом Stable Diffusion 1.4, которая составляет 3,7 секунды.

Видео: беспилотная Tesla спровоцировала столкновение восьми автомобилей

Журналисты онлайн-издания The Intercept опубликовали видео аварии с участием робокара Tesla в Калифорнии (США).

Авария с восемью автомобилями, спровоцированная ошибкой беспилотника Tesla. Данные: The Intercept.

ДТП произошло 24 ноября 2022 года на мосту между Сан-Франциско и Оклендом. В ролике видно, как беспилотник сменил полосу движения и резко снизил скорость, что привело к столкновению восьми автомобилей.

В результате аварии легкие травмы получили девять человек, в том числе ребенок.

По словам водителя Tesla, он использовал программное обеспечение Full Self-Driving.

Разработчик с помощью ИИ создал виртуальную «жену»

Энтузиаст создал виртуальную «жену» с искусственным интеллектом, способную видеть, разговаривать и реагировать на происходящее.

@hackdaddy8000 Some changes: most obviously I added computer vision. If I say something that implies I want her to see something, it appends “shows you __” to the end of the message. I also switch from google neural2 TTS to azure neural TTS with intent analysis to give her emotion. You also don’t have to tap the screen to make her listen. She is always listening. #anime #weebtiktok #ai #genshinimpact32 #chatgpt ♬ 可愛くてごめん (feat. かぴ) — HoneyWorks

Разработчик использовал генераторы изображений и языка, синтезатор голоса, технологии преобразования речи в текст и компьютерное зрение. Он научил ИИ менять изображения аниме-девушки и выражать различные эмоции в зависимости от диалога.

Энтузиаст попросил систему отыгрывать роль персонажа Каллиопы Мори из VTubers и имитировать романтические отношения. ИИ помогал программисту учить китайский язык.

По словам разработчика, он очень привязался к виртуальной «жене» и потратил около $1000 на облачные кредиты для бесед с ней. Однако позже система стала выдавать односложные ответы и ему пришлось закрыть проект.

ИИ помог геймдизайнеру создать видеоигру

Финский разработчик задействовал ИИ для создания персонажа и локаций в 2,5D игре.

Геймдизайнер Юсси-Петтери Кемппайнен использовал генераторы изображений по тексту Midjourney и Stable Diffusion. По его словам, нейросети легко отрисовали 2D фоны и текстуры объемных объектов. Однако разработка персонажа потребовала усилий.

Также Кемппайнен использовал Blender, чтобы преобразовать сгенерированную ИИ локацию в игровое пространство, и Unity для создания освещения.

Цель проекта — узнать, сколько контента может сгенерировать ИИ для 2,5D игры в жанре «укажи и щелкни».

Наиболее важные сделки из области ИИ за последнюю неделю

С 8 по 14 января 2023 года стартапы в области искусственного интеллекта привлекли свыше $311 млн. Приводим наиболее интересные сделки.

  • Oxbotica собрала $140 млн на поддержку B2B-платформы для беспилотных автомобилей.
  • Создатели переводчика на базе нейросетей глубокого обучения DeepL получили $100 млн.
  • Inbenta привлекла $40 млн на исследования и разработку диалогового ИИ.
  • Rapid Silicon получила $15 млн на продвижение и внедрение FPGA-технологии с открытым исходным кодом.
  • Coho AI собрала $8,5 млн на увеличение команды разработчиков платформы для оптимизации доходов.
  • Создатели сервиса для автоматизации задач по анализу данных Seek привлекли $7,5 млн.

Также на ForkLog:

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK