Telegram (AI) YouTube Facebook X
En
ии-стартап Anthropic AI

Anthropic представила динамические рабочие процессы для Claude Code

Компания Anthropic выпустила Claude Opus 4.8 и отдельно представила для Claude Code функцию динамических рабочих процессов.

Инструмент позволяет ИИ самому писать оркестрационные скрипты, запускающие десятки или сотни параллельных субагентов, и проверять работу до передачи результата пользователю.

Он рассчитан на сложные задачи в крупных кодовых базах: аудит безопасности, поиск ошибок, миграция между фреймворками и языками программирования, модернизация проектов.

Функция доступна в режиме предварительного тестирования в интерфейсе командной строки Claude Code, настольной версии и расширении для VS Code, через API, а также в Amazon Bedrock, Vertex AI и Microsoft Foundry.

Запустить режим можно прямой командой на создание рабочего процесса или через ultracode. Он повышает уровень вычислительных усилий до максимального и позволяет модели самостоятельно решать, когда задействовать многошаговую схему.

В Anthropic предупредили: динамические рабочие процессы потребляют существенно больше токенов, чем стандартная сессия Claude Code.

Модель разбивает задачу на подзадачи, распределяет их между параллельными агентами, затем объединяет выводы после взаимной проверки и попыток опровергнуть найденные решения.

В качестве примера Anthropic привела перенос Bun с языка программирования Zig на Rust. Разработчик Джаред Самнер использовал динамические рабочие процессы для генерации около 750 000 строк Rust-кода. Порт добился прохождения 99,8% существующего набора тестов, а путь от первого коммита до слияния занял 11 дней. При этом Anthropic уточнила, что версия пока не используется в продакшене.

Показатели новой модели Opus 4.8:

  • 69,2% в SWE-Bench Pro;
  • 49,8% в Humanity’s Last Exam без инструментов и 57,9% с ними;
  • 83,4% в OSWorld-Verified;
  • 1890 баллов в GDPval-AA;
  • 53,9% в Finance Agent v2.

В Terminal-Bench 2.1 Opus 4.8 уступила GPT-5.5 — 74,6% против 78,2%.

В Anthropic заявили, что Opus 4.8 стала заметно «честнее» при выполнении агентных задач: модель чаще указывает на неопределенность, реже заявляет о неподтвержденном прогрессе и лучше замечает проблемы в собственном коде до передачи результата пользователю.

Напомним, в мае Anthropic опубликовала первый отчет по Project Glasswing — программе поиска уязвимостей с помощью модели Claude Mythos.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK
Exit mobile version