Тизер GPT-4, виртуальная фотостудия и другие новости из мира ИИ
Мы стремимся информировать читателей не только о событиях в биткоин-индустрии, но и рассказывать о том, что происходит в смежных технологических сферах — кибербезопасности и в мире искусственного интеллекта (ИИ).
ForkLog AI собрал наиболее важные новости из мира ИИ за прошедшую неделю.
- Сотрудник Microsoft Germany заявил о скором релизе GPT-4.
- Google раскрыла дату проведения конференции I/O.
- Американские сенаторы представили законопроект, запрещающий TikTok на территории страны.
- Вышел официальный плагин Stable Diffusion для Blender.
- Google Translate научился переводить текст на изображениях.
- ChatGPT интегрируют в Slack.
- Японские исследователи научили искусственный интеллект воссоздавать изображения по данным мозговой активности.
- Наиболее важные сделки из области ИИ за последнюю неделю.
Microsoft: релиз GPT-4 состоится на следующей неделе
9 марта четыре сотрудника немецкого подразделения корпорации выступили с докладом на мероприятии «AI in Focus — Digital Kickoff». Технический директор Microsoft Germany Андреас Браун вскользь упомянул о выходе новой версии языковой модели.
«Мы представим GPT-4 на следующей неделе. У нас есть мультимодальные модели, которые будут предлагать совершенно другие возможности, например, видео», — сообщил он.
Google I/O состоится 10 мая
10 мая компания Google проведет ежегодную конференцию I/O. Онлайн-трансляция мероприятия будет доступна для всех желающих.
Ожидается, что большинство анонсов посвятят искусственному интеллекту. Детальное расписание конференции появится ближе к дате ее проведения.
В США зарегистрировали законопроект для блокировки TikTok
Двухпартийная группа американских сенаторов представила законопроект, направленный на запрет TikTok в США.
В случае принятия документа Министерство торговли наделят правом блокировать иностранные технологии, представляющие «национальную угрозу». Под запретом могут оказаться сервисы из Китая, Кубы, Ирана, Северной Кореи, России и Венесуэлы.
Администрация президента США Джо Байдена поддержала законопроект и призвала Конгресс «действовать быстро».
Языковая модель Meta утекла в сеть
Большая языковая модель LLaMA компании Meta утекла в сеть. Исходный код инструмента появился на имиджборде 4chan.
Компания представила модель в конце февраля 2023 года. Доступ к ней имело утвержденное число пользователей.
Техгигант не стал отрицать утечку. Также представитель Meta подтвердил приверженность к открытости моделей для исследователей.
Stability AI выпустила плагин для Blender
Компания Stability AI выпустила официальный плагин Stable Diffusion для приложения для 3D-моделирования Blender.
Дополнение позволяет художникам создавать изображения с использованием текстовых описаний непосредственно в программе. Также можно использовать существующие рендеры, что позволяет экспериментировать с различными стилями для проекта без необходимости полностью переделывать сцену.
Кроме этого, доступно генерирование текстур и анимации.
Stability for Blender полностью бесплатный. Его можно установить с помощью API-ключа.
Google Translate научился переводить текст на изображениях
Веб-версия сервиса Google Translate научилась переводить текст на картинках.
Чтобы воспользоваться функцией, необходимо нажать на кнопку «Изображения», расположенную над полем ввода текста, и загрузить файл. Через какое-то время сервис выдаст результат с наложенным переводом поверх картинки, которую можно скачать на устройство. Также есть возможность скопировать текст.
Подпись под результатом «Переведено Объективом» указывает на то, что функция использует те же генеративно-состязательные нейросети, что и AR Translate для Google Lens в смартфонах.
ChatGPT интегрируют в Slack
В корпоративный мессенджер Slack интегрируют ChatGPT для помощи в создании ответов на сообщения. Функция доступна участникам списка ожидания.
Чтобы воспользоваться ботом в мессенджере, необходимо щелкнуть на значок с тремя точками в цепочке и нажать «Создать черновик».
Кроме этого, ChatGPT в Slack может помочь найти ответы «по любому проекту или теме», а также обобщать переписки и каналы.
Google рассказала о ходе разработки модели для 1000 языков
Инженеры компании Google поделились прогрессом в создании Universal Speech Model (USM), поддерживающей 1000 различных языков.
По данным разработчиков, модель имеет 2 млрд параметров. Ее обучили на 12 млн часов речи и 28 млрд предложений.
На сегодня USM поддерживает более 100 языков. Модель уже используют в YouTube для автоматического создания субтитров.
ИИ научили воссоздавать изображения по мозговой активности
Японские исследователи научили искусственный интеллект воссоздавать изображения по данным мозговой активности человека с помощью Stable Diffusion.
Сначала ученые показали испытуемым картинки и попросили «представлять их себе» во время фМРТ-сканирования. Затем исследователи с помощью сложных алгоритмов несколько раз обрабатывали полученные сигналы.
Полученные результаты они использовали в качестве входных данных для Stable Diffusion, которая сгенерировала близкие к оригиналам картинки.
Однако, по словам ученых, получить реконструкцию высококачественных изображений удалось только после точной настройки модели. Это приводит к некоторым ограничениям, добавили они.
Представлена ИИ-фотостудия с виртуальными моделями
Нидерландский разработчик Дэнни Постма открыл ИИ-фотостудию Deep Agency с виртуальными моделями.
Сервис основан на алгоритмах генерации изображений по текстовому описанию. С помощью подсказок пользователи смогут указывать позу и действия модели, а также настраивать другие параметры фотографии.
В бесплатной версии доступен один аватар. Платная подписка в размере $29 в месяц добавляет еще три модели, а также открывает возможность создать цифрового двойника по собственным фотографиям.
Наиболее важные сделки из области ИИ за последнюю неделю
С 5 по 11 марта 2023 года стартапы в области искусственного интеллекта привлекли свыше $740 млн. Приводим наиболее интересные сделки.
- ИИ-стартап Anthropic, основанный экс-сотрудниками OpenAI, привлек $300 млн от фонда Spark Capital.
- Маркетинговая платформа SOCi получила $120 млн.
- Основанный бывшими сотрудниками Apple стартап Humane собрал $100 млн.
- Разработчики ИИ-системы контроля цепочки поставок Overhaul привлекли $73 млн.
- Plus One, создающая роботов-сортировщиков посылок, получила $50 млн.
- Разработчик голографических систем для автомобилей Envisics собрал $50 млн.
- Финтех-стартап Candidly привлек $20,5 млн.
- Производитель ИИ-чипов Mythic получил $13 млн.
- Платформа для сбора денежных средств на основе искусственного интеллекта Growfin собрала $7,5 млн.
- Monnai привлек $6,5 млн на продвижение ИИ-решений для финтех-компаний.
Также на ForkLog:
- Число активных пользователей Bing превысило 100 млн.
- Meta снизила цены на VR-шлемы.
- Microsoft создала универсальную нейросеть Kosmos-1.
- ИИ-пилот победил человека в воздушном бою за 90 секунд.
- Глава Microsoft назвал голосовых ассистентов «тупыми».
- Аферисты «вооружились» ИИ для имитации голосов родственников своих жертв.
- Пользователи нашли способ обойти модерацию ChatGPT.
Что почитать на выходных
Какие перспективы ChatGPT, вытеснят ли роботы людей, этично ли использовать ИИ на войне, читайте в интервью с основателем стартапа по цифровому клонированию человека Pheon Юрой Фицджеральдом.
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!