
DeepSeek выпустил новую ИИ-модель V3.1
Китайский ИИ-стартап DeepSeek обновил свою флагманскую ИИ-модель V3 и удалил упоминание рассуждающей нейросети R1 в чат-боте. Об этом пишет SCMP.
Компания объявила о выпуске V3.1 в WeChat. Обновление расширяет контекстное окно модели до 128 000 токенов, позволяя ей хранить больше информации при взаимодействии с пользователем. Такой объем соответствует книге примерно на 300 страниц.
Также отмечается высокая эффективность использования токенов.
В бенчмарке Aider Polyglot, оценивающем LLM в решении сложных задач программирования сразу на нескольких языках, DeepSeek V3.1 превосходит Claude 4 Opus.
DeepSeek V3.1 beats Claude 4 Opus on Aider Polyglot
— Lisan al Gaib (@scaling01) August 19, 2025
This makes it the best non-TTC coding model and all of that for ~$1 pic.twitter.com/QyJZnVRdVK
V3.1 сохраняет баланс между скоростью и качеством генерации. Она содержит 685 миллиардов параметров и базируется на гибридной архитектуре, обеспечивающей высокую производительность в задачах диалога, рассуждения и программирования.
DeepSeek удалила упоминание R1 из функции глубокого мышления. В SCMP предположили, что это может указывать на трудности при разработке ожидаемой версии R2.
21 августа компания опубликовала официальный анонс в X.
Introducing DeepSeek-V3.1: our first step toward the agent era! 🚀
— DeepSeek (@deepseek_ai) August 21, 2025
🧠 Hybrid inference: Think & Non-Think — one model, two modes
⚡️ Faster thinking: DeepSeek-V3.1-Think reaches answers in less time vs. DeepSeek-R1-0528
🛠️ Stronger agent skills: Post-training boosts tool use and…
Среди ключевых особенностей декларируются:
- гибридный режим рассуждений — модель сама принимает решение о необходимости задействования большего количества ресурсов для «обдумывания» вопроса;
- более быстрое мышление — V3.1 предоставляет ответ оперативнее DeepSeek-R1-0528;
- улучшение агентских навыков.
ИИ-стартап DeepSeek привлек внимание в январе выпуском модели R1, ориентированной на рассуждения. Она продемонстрировала высокую эффективность при низких капиталовложениях, из-за чего среди экспертов возникли сомнения касательно необходимости миллиардных вливаний в ИИ-сектор и раздутости индустрии.
Напомним, в июне китайский стартап начал найм стажеров для маркировки медицинских данных с целью улучшить применение искусственного интеллекта в больницах.
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!