Gemini 2.0: Google выпустила ряд ИИ-обновлений

  • Google выпустила новую модель Gemini 2.0, которая мощнее предыдущей и оснащена функциями мультимодальности.
  • В обновленную версию добавлен инструмент Deep Research для рассуждений.
  • Дополнительно представлен ИИ-агент Project Mariner — он способен выполнять действия на компьютере вместо пользователя.
  • Google анонсировала улучшение системы сводок поисковых запросов AI Overviews.

11 декабря Google представила «свою самую мощную на сегодняшний день» модель искусственного интеллекта — Gemini 2.0.

Первоначально запущена экспериментальная версия 2.0 Flash, которая имеет высокую производительность, функции мультимодальности и «прокладывает путь для нового агентского опыта».

Gemini 2.0 Flash превосходит 1.5 Pro по ключевым метрикам, демонстрируя удвоенную скорость. Она способна генерировать изображения, текст и речь на нескольких языках. Сообщается, что модель значительно улучшена в областях программирования и анализа картинок. 

2.0 Flash становится флагманской нейросетью вместо 1.5 Pro. Новая нейросеть может использовать сторонние приложения и сервисы вроде поиска Google и внешних API, что отличает ее от предыдущего поколения.

Gemini 2.0 Flash доступна в чат-версии для всех желающих, экспериментальная мультимодальная нейросеть с функциями преобразования текста в речь и изображения — для разработчиков через Gemini API в Google AI Studio и Vertex AI. В ближайшие месяцы улучшенная версия ИИ плавно распространится на разные продукты вроде Android Studio, Chrome DevTools, Firebase, Gemini Code Assist и другие.

ИИ-агент Google

ИИ-подразделение Google — DeepMind — представило своего первого ИИ-агента, который способен самостоятельно действовать в интернете. 

Project Mariner создан на базе Gemini 2.0 и доступен ограниченной группе тестировщиков. Он контролирует браузер Chrome, перемещает курсор на экране, нажимает на кнопки, заполняет формы, то есть способен перемещаться по веб-сайтам и вести себя как человек.

После настройки ИИ-агента справа в браузере появляется окно чата. Там можно задать инструкции нейросети, например, предложить создать корзину покупок из продуктового магазина на основе прикрепленного списка.

Данные: Google.

После указания всех параметров агент перейдет на веб-сайт супермаркета, найдет нужные товары и добавит в виртуальную корзину. Скорость его работы медленная — на нажатие одной кнопки уходит около пяти секунд.

Project Mariner не способен заполнить номера кредитных карт и другую платежную информацию, принимать файлы cookie и подписывать соглашения по предоставлению услуг. Это сделано намеренно, чтобы у пользователей оставалось больше контроля.

Агент может использоваться для поиска рейсов, отелей, рецептов, покупки предметов и других задач. Во время выполнения запроса пользоваться компьютером нельзя.

Project Mariner пока недоступен широкой общественности, дата его публичного релиза неизвестна.

Другие ИИ-агенты

Помимо Project Mariner корпорация Google представила ряд других ИИ-агентов для более узкоспециализированных задач:

  • Deep Research способен помочь исследовать сложные темы, создавая многоэтапные планы обучения. Он не предназначен для решения математических и логических задач, написания кода или анализа данных;
  • Jules может программировать, он интегрируется в рабочие процессы на GitHub, появится в 2025 году;
  • еще один ИИ ориентирован на помощь в видеоиграх, дата его выпуска неизвестна.

Gemini научили рассуждать

Обновленная версия Gemini получила функцию Deep Research, которая использует «продвинутые рассуждения» и «возможности длинного контекста» для создания краткой выдержки об исследованиях. Брифы можно экспортировать в Google Docs для дополнительного редактирования.

Сервис может анализировать информацию касательно запроса с помощью интернета, выступая в роли своего рода научного сотрудника. Результат раздумий подается в виде краткого резюме с ссылками на источники. Процедура следующая:

  1. Пользователь пишет запрос.
  2. Deep Research создает «многоэтапный план исследования».
  3. Пользователь подтверждает старт анализа.
  4. Deep Research проводит исследование в течение нескольких минут и генерирует ответ.

Сервис доступен для владельцев платной версии Gemini Advanced.

AI Overviews станет умным и мультимодальным

Google анонсировала улучшение системы сводок поисковых запросов AI Overviews. Сообщается, что сервис вскоре сможет обрабатывать «более сложные темы», «мультимодальные» и «многоэтапные» поиски, в том числе расширенные математические запросы и задачи программирования.

Тестирование функционала начнется на этой неделе, а широкое распространение — в начале следующего года.

Улучшение AI Overviews обусловлено запуском Gemini 2.0. 

Напомним, в ноябре Google обучила чат-бот Gemini запоминать контекстную информацию о жизни пользователя, интересах и предпочтениях. 

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK
Exit mobile version