Colab научился писать код, Meta представила языковые модели и другие новости из мира ИИ

AI_Digest_1
AI_Digest_1

Мы стремимся информировать читателей не только о событиях в биткоин-индустрии, но и рассказывать о том, что происходит в смежных технологических сферах — кибербезопасности и в мире искусственного интеллекта (ИИ).

ForkLog AI собрал наиболее важные новости из мира ИИ за прошедшую неделю.

  • TikTok обжаловал в суде блокировку в Монтане.
  • Meta научила ИИ понимать 4000 живых языков.
  • Tencent запустила технологию распознавания ладоней для оплаты поездок в пекинском метро.
  • В Photoshop добавили генератор изображений.
  • ИИ научили трансформировать мысли людей в видео.
  • Писатель с помощью ChatGPT и Midjourney создал 97 книг.
  • Наиболее важные сделки из области ИИ за последнюю неделю.

TikTok обжаловал в суде блокировку в Монтане

Представители сервиса TikTok подали в суд на Монтану (США) из-за блокировки приложения на территории штата. Ответчиком указан генпрокурор Остин Кнудсен.

Согласно иску, запрет нарушает право граждан на свободу слова, закрепленное в Первой поправке к Конституции США, и ряд других законов.

В Google Colab появится генератор кода

В ближайшие месяцы Google добавит в Colab ИИ-функции для автоматического программирования.

Облачная среда будет использовать семейство моделей Codey, основанное на PaLM 2. Алгоритмы обучили на большом наборе фрагментов кода с разрешающей лицензией из внешних источников и настроили для языка Python.

Среди новых функций:

  • генерация строк с помощью подсказок на естественном языке;
  • автозаполнение кода;
  • чат-бот для ответов на вопросы по программированию.

Изначально обновление станет доступно владельцам платной подписки Colab из США. Позже Google сделает ИИ-функции кодирования бесплатными для широкой аудитории.

Meta научила ИИ понимать 4000 живых языков

Компания Meta представила семейство языковых ИИ-моделей Massively Multilingual Speech (MMS). Исходный код проекта доступен на GitHub.

MMS могут идентифицировать более 4000 разговорных языков, что в 40 раз превышает возможности существующих аналогов. Также алгоритмы научили синтезировать речь и преобразовывать ее в текст на около 1100 диалектах.

Доступные языки в моделях Meta MMS
Доступные языки в моделях MMS. Данные: Meta.

Для обучения моделей разработчики использовали Новый Завет, на основе которого создали два датасета. Первый содержит аудио и текст на 1107 языках. Второй включает немаркированные записи речи на 3809 диалектах.

В компании предупредили, что иногда MMS способны неправильно расшифровать определенные слова и фразы. Также в Библии много предвзятости и искажений, добавили в Meta.

Tencent внедрила систему оплаты по распознаванию ладони

Компания Tencent запустила технологию распознавания ладоней для оплаты поездок в метро Пекина через сервис WeChat Pay.

Систему создала ИИ-лаборатория компании YouTu. Она идентифицирует не только ладони, но и вены, а также учитывает действия при вытягивании руки во время сканирования и другие характеристики. По данным разработчиков, технология функционирует в различных условиях освещения.

Пользователю необходимо привязать учетную запись WeChat к устройству распознавания и снять отпечаток ладони в специальном автомате на станции метро. Затем он сможет оплатить поездку, проведя рукой над сканером в турникете.

Компания протестировала систему в Шэньчжэне. В будущем она планирует использовать технологию в офисах, кампусах, торговых центрах, ресторанах и других местах.

Bard научился искать картинки

Чат-бот Bard научился показывать изображения из поисковика Google.

Например, на вопрос пользователя о достопримечательностях Нового Орлеана (Луизиана, США) чат-бот выдаст список мест и их фото. Каждая картинка содержит ссылку на источник.

Поиск изображений в Google Bard
Поиск изображений в Bard. Данные: Google.

Также пользователь может запрашивать у ИИ изображения напрямую.

В Photoshop добавили генератор изображений

Компания Adobe добавила в Photoshop генеративный ИИ-инструмент Generative Fill.

Технология базируется на моделях Firefly. Она позволяет с помощью текстовых запросов на английском языке масштабировать изображения, а также добавлять и удалять объекты. Инструмент учитывает перспективу, освещение и стиль.

Пример использования Generative Fill в Adobe Photoshop
Пример использования Generative Fill. Данные: Adobe.

Компания также добавила в редактор новую панель задач с кнопкой Generative Fill, которая появляется при выделении объектов. Она позволяет быстро менять изображения даже без подсказок.

Generative Fill доступен в бета-версии Photoshop для ПК. Полноценный релиз технологии состоится во второй половине 2023 года.

YouTube задействовал ИИ для описания видеороликов Shorts

Сервис YouTube внедрил визуальную языковую модель Flamingo для создания описаний видео в разделе Shorts.

Разработанный DeepMind алгоритм анализирует начальные кадры ролика и пытается понять его содержание. Сгенерированные моделью описания хранятся в виде метаданных для «лучшей классификации видео и сопоставления результатов поиска с запросами зрителей».

По словам директора по управлению продуктами YouTube Shorts Тодда Шермана, ИИ-текст соответствует стандартам ответственности платформы. Ситуации, в которых технология может выставить видео «в плохом свете», маловероятны, добавил он.

Представитель DeepMind заявил, что Flamingo уже создал описания для множества роликов, включая наиболее просматриваемые.

Ученые создали алгоритм манипулирования изображениями

Специалисты из Института информатики общества Макса Планка, MIT и Google создали ИИ-алгоритм DragGAN для манипулирования изображениями.

Технология похожа на инструмент «Искривление» в Photoshop. Согласно исследованию, она не просто перемещает пиксели, а применяет искусственный интеллект для повторного создания базового объекта.

С помощью DragGAN можно менять размеры предметов и их внешний вид парой щелчков мыши. Также алгоритм позволяет вращать объекты как 3D-модели.

По словам исследователей, подход способен не только создавать окклюзию предметов, но и деформировать их в соответствии с жесткостью, например, при сгибании ноги лошади.

Google расширила инструмент прогнозирования наводнений в 80 странах

Компания Google расширила доступность ИИ-системы прогнозирования наводнений Flood Hub.

Платформу могут использовать правительства, организации по оказанию помощи и жители 80 стран из Азиатско-Тихоокеанского региона, Африки, Европы, Южной и Центральной Америки. Теперь она охватывает области с высоким процентом населения, подверженным риску стихийного бедствия, вроде Нидерландов, Вьетнама, Лаоса, Камбоджи и Мьянмы.

Flood Hub с помощью двух моделей предсказывает наводнения, вызванные переполнением рек и ручьев, на семь дней вперед. Система определяет количество попадающей в поток воды, ожидаемую высоту затопления и районы, которые затронет бедствие.

ИИ научили трансформировать мысли людей в видео

Сингапурские и китайские исследователи разработали ИИ-алгоритм MinD-Video для реконструкции видео по данным мозговой активности.

Система представляет собой «двухмодульный конвейер» из обученного кодировщика фМРТ и отлаженной версии генератора изображений Stable Diffusion. Для ее тренировки специалисты использовали общедоступный датасет, содержащий ролики и записи активности мозга испытуемых, которые их смотрели.

first_fig.6dc103c0a265e5faf4e9
Пример работы MinD-Video. Данные: исследование «Компьютерное зрение и распознавание образов».

По словам исследователей, алгоритм реконструирует видео с точностью 85%. Ролики оказались «достаточно высококачественными», что можно определить по движениям и динамике сцен, добавили они.

Писатель с помощью ИИ создал 97 книг

Фантаст Тим Буше задействовал ИИ для написания серии книг AI Lore.

Автор использовал чат-ботов ChatGPT и Anthropic Claude, а также генератор изображений Midjourney. Каждое произведение содержит от 2000 до 5000 слов и включает от 40 до 140 иллюстраций.

За девять месяцев Буше создал 97 книг. По его словам, он заработал почти $2000 на продаже 574 копий.

Наиболее важные сделки из области ИИ за последнюю неделю

С 21 по 27 мая стартапы в области искусственного интеллекта привлекли свыше $969 млн. Приводим наиболее интересные сделки.

  • Anthropic привлек $450 млн на создание «полезных, безвредных и честных систем искусственного интеллекта».
  • ИИ-команда Tools for Humanity, в которую входят разработчики криптостартапа Сэма Альтмана Worldcoin, собрала $115 млн.
  • Венчурная компания, использующая искусственный интеллект для поиска перспективных стартапов, Moonfire получила $115 млн. 
  • Маркетинговая ИИ-платформа Insider собрала $105 млн.
  • Figure привлек $70 млн на создание робота-гуманоида.
  • FlowX AI получил $35 млн на развитие технологии, позволяющей предприятиям переносить устаревшее и новое ПО в единое место для разработки и запуска основанных на нем приложений и сервисов.
  • Elementl собрал $33 млн на поддержку платформы оркестрации данных на базе Dagster.
  • Создатели роботизированных манипулятора и вездехода для использования в космосе Gitai получили $30 млн.
  • Datasembly привлекла $16 млн на развитие аналитической платформы, использующей большие данные, для ритейлеров и производителей товаров народного потребления.

Также на ForkLog:

Что почитать на выходных?

ForkLog рассмотрел основные концепции этичного ИИ и постарался разобраться, действительно ли это важно для разработки безопасного искусственного интеллекта.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK