
В The Economist описали будущее «агентного» ИИ-интернета
Искусственный интеллект может сделать мечту британского информатика Тима Бернерс-Ли реальностью — большую часть рутинных задач начнут выполнять ИИ-агенты. Об этом пишет The Economist.
В 1999 году, через 10 лет после изобретения всемирной паутины, эксперт описал будущее, в котором составление планов или поиск информации возьмут на себя «интеллектуальные агенты» — машины, способные читать, интерпретировать и действовать.
С момента изобретения интернет существенно изменился, но взаимодействие с ним по-прежнему требует личного внимания человека.
Современные большие языковые модели (LLM) меняют ситуацию. Они умеют резюмировать документы, отвечать на вопросы, искать информацию и рассуждать. Однако одной составляющей им не хватает — действий.
Нужно изменить интернет
Технический директор Microsoft Кевин Скотт считает, что появление полностью самостоятельных цифровых помощников «не так уж и далеко». Основным препятствием является язык — им нужно дать возможность общаться с онлайн-сервисами и друг с другом.
Интернет-ресурсы обычно общаются с внешним миром через интерфейс прикладного программирования (API). Он сообщает посетителям о том, что может делать, например, записывать на прием к врачу или предоставлять местоположение на карте.
Проблема в том, что API созданы для людей, и каждый из них имеет свои особенности и документацию. Это сложная среда для ИИ-агентов. Работа с каждым новым ПО требует изучения его «диалекта».
Чтобы цифровые помощники смогли действовать в интернете независимо, им понадобится стандартизация способа общения. Это является целью протокола Model Context Protocol (MCP) от ИИ-стартапа Anthropic.
Решения — есть
Директор по продуктам американской компании Майк Кригер отметил, что идея MCP возникла во время подключения Claude к Gmail и GitHub. Вместо интеграции каждого приложения с чат-ботом компания хотела создать общий набор правил.
Агент может спросить сервер MCP о том, что делает система — бронирует рейс, отменяет подписку, платит компенсацию и так далее. Затем выполняется действие от имени пользователя.
Например, юзер решил забронировать поездку из Лондона в Нью-Йорк. Процедура следующая:
- Он сообщает о планах туристическому агенту.
- Помощник распределяет задачу между специализированными ИИ-ассистентами, которые могут искать рейсы, отели и автомобили;
- Они связываются с серверами MCP авиакомпаний, отелей и фирм по прокату машин, собирают информацию, сравнивают возможности и создают список хороших маршрутов.
- Пользователь выбирает вариант, а туристический агент бронирует все необходимое.
Для такой координации нужны правила, которые определяют, как цифровые помощники идентифицируют друг друга, общаются между собой и доверяют. Для этого Google предлагает протокол agent-to-agent (A2A). С его помощью агенты могут договариваться о том, кто и что будет делать.
В декабре Linux Foundation сформировала организацию Agentic AI Foundation (AAIF). Ее цель — предотвратить фрагментацию сегмента ИИ-агентов на множество несовместимых, закрытых продуктов.
Фонд станет нейтральной средой для развития открытых проектов в сфере цифровых ассистентов. Ключевой вклад в запуск инициативы внесли:
- Anthropic — предоставила Model Context Protocol (MCP), стандарт для подключения моделей к внешним данным и инструментам;
- Block — открыла платформу для цифровых помощников Goose;
- OpenAI — предложила решение AGENTS.md, файл инструкций для упрощенной настройки инструментов разработки в репозиториях.
Экосистема MCP уже охватывает более 10 000 активных публичных реестров.
Среди других членов AAIF: AWS, Bloomberg, Cloudflare, Google, Cisco, Datadog, Docker, IBM, Oracle, SAP, Snowflake, Twilio, Hugging Face, Uber, SUSE и другие.
Большая часть веб-сайтов, которые будут просматривать агенты, создана для человеческого глаза. Для поиска продукта по-прежнему нужно кликать по меню.
Microsoft создала Natural Language Web (NLWeb), чтобы LLM могли легче получать доступ к ресурсам.
Инструмент позволяет людям «общаться» с любой веб-страницей привычной речью. Пользователи могут спросить на туристическом сайте о предпочитаемых вариантах отдыха с тремя детьми. NLWeb поймет смысл вопроса и ответит на естественном языке.
Каждый подключенный к NLWeb ресурс может действовать как сервер MCP, предоставляя свой контент агентам. Таким образом инструмент соединяет современный визуальный интернет с тем, который нужен ИИ-ассистентам.
Битва платформ
По мере развития ИИ-агентов начинает формироваться битва платформ для них, напоминающая браузерные войны 1990-х годов.
Тогда компании боролись за контроль над доступом к интернету. Сейчас браузеры переосмысливаются из-за интеграции цифровых ассистентов. OpenAI и Perplexity запустили собственные решения на базе ИИ-помощников, которые могут отслеживать рейсы, анализировать документы и управлять электронной почтой.
Их амбиции этим не ограничились. OpenAI добавила в ChatGPT возможность прямых покупок с определенных сайтов и интегрировала поддержку различных сервисов вроде Spotify и Figma.
Подобные действия беспокоят действующих игроков рынка. Amazon потребовала от Perplexity удалить браузер со встроенным ИИ-агентом из своего интернет-магазина. Приложение для аренды Airbnb решило не интегрироваться с ChatGPT, поскольку «функция еще не совсем готова».
Адаптация рекламы
Реклама должна адаптироваться. Сегодняшний интернет работает на монетизации внимания людей. Alphabet и Meta — одни из крупнейших техгигантов и главные выгодоприобретатели.
Эксперт по компьютерам из Калифорнийского университета в Беркли Дон Сонг считает, что маркетологам придется ориентироваться не на людей, а на «внимание агентов». Тактика при этом может остаться прежней: оптимизация рейтингов, таргетирование предпочтений, оплата размещения. Но аудиторией станут алгоритмы.
Цифровые ассистенты способны значительно расширить активность в интернете. Основатель ИИ-стартапа Parallel Web Systems Параг Агравал отметил, что интернет создан для людей, читающих с человеческой скоростью. У агентов подобных ограничений нет. Они способны сканировать тысячи страниц за секунды, переходить по ссылкам, которые люди пропускают, и выполнять несколько задач одновременно.
Есть определенные риски. ИИ может ошибаться, также как и человек. Дополнительно присутствует вероятность внешних атак вроде скрытых вредоносных команд в веб-страницах или файлах.
Меры безопасности призваны снизить возникновение проблем. Одна из них — ограничить агентов только теми услугами, которым стоит доверять. Другая — предоставить узкий спектр полномочий. Для наиболее чувствительных задач можно подключать человека.
Напомним, в ноябре эксперты Microsoft представили среду для тестирования ИИ-агентов и выявили уязвимости, присущие современным цифровым помощникам.
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!