DeepSeek улучшил ИИ-модель V3

Китайский ИИ-стартап DeepSeek выпустил крупное обновление для своей языковой модели V3. DeepSeek-V3-0324 доступна на платформе Hugging Face.
Новая версия нейросети улучшена в областях рассуждений, программирования и письма. Она обходит предшественника и решения от конкурирующих компаний в ряде бенчмарков.
DeepSeek стала заметным игроком на рынке искусственного интеллекта в январе. Тогда компания выпустила ориентированную на рассуждения модель с открытым исходным кодом DeepSeek-R1, которая разработана на существенно меньший бюджет.
V3 с 671 млрд параметров появилась в декабре 2024 года.
CEO китайского стартапа 01.AI Ли Кай-фу считает, что Китай сократил разрыв с США в развитии искусственного интеллекта до трех месяцев, поскольку компании вроде DeepSeek научились использовать чипы и применять алгоритмы более эффективно.
Страна уже стала лидером в области разработки ПО для инфраструктуры, добавил он.
«Раньше, я думаю, разрыв составлял от шести до девяти месяцев, и мы отставали во всем. А сейчас я думаю, что, возможно, на три месяца отстаем в некоторых основных технологиях, а в других специфических областях опережаем», — сказало Кай-фу.
Санкции США создавали краткосрочные проблемы, но также заставляли китайские компании внедрять инновации, подчеркнул эксперт.
Напомним, после резкого взлета популярности ИИ-моделей DeepSeek на компанию обратили внимание власти Китая. Сотрудники работают в новых, более жестких условиях.
Ранее OpenAI рекомендовала правительству США запретить решения китайского конкурента, поскольку проект «субсидируется государством» и «контролируется им».
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!