DeepSeek улучшил ИИ-модель V3

deepseek

Китайский ИИ-стартап DeepSeek выпустил крупное обновление для своей языковой модели V3. DeepSeek-V3-0324 доступна на платформе Hugging Face.

Новая версия нейросети улучшена в областях рассуждений, программирования и письма. Она обходит предшественника и решения от конкурирующих компаний в ряде бенчмарков. 

DeepSeek улучшил ИИ-модель V3
Сравнение DeepSeek-V3-0324 с другими ИИ-моделями в разных тестах. Данные: Hugging Face.

DeepSeek стала заметным игроком на рынке искусственного интеллекта в январе. Тогда компания выпустила ориентированную на рассуждения модель с открытым исходным кодом DeepSeek-R1, которая разработана на существенно меньший бюджет. 

V3 с 671 млрд параметров появилась в декабре 2024 года.

CEO китайского стартапа 01.AI Ли Кай-фу считает, что Китай сократил разрыв с США в развитии искусственного интеллекта до трех месяцев, поскольку компании вроде DeepSeek научились использовать чипы и применять алгоритмы более эффективно.

Страна уже стала лидером в области разработки ПО для инфраструктуры, добавил он.

«Раньше, я думаю, разрыв составлял от шести до девяти месяцев, и мы отставали во всем. А сейчас я думаю, что, возможно, на три месяца отстаем в некоторых основных технологиях, а в других специфических областях опережаем», — сказало Кай-фу.

Санкции США создавали краткосрочные проблемы, но также заставляли китайские компании внедрять инновации, подчеркнул эксперт. 

Напомним, после резкого взлета популярности ИИ-моделей DeepSeek на компанию обратили внимание власти Китая. Сотрудники работают в новых, более жестких условиях.

Ранее OpenAI рекомендовала правительству США запретить решения китайского конкурента, поскольку проект «субсидируется государством» и «контролируется им». 

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK
Exit mobile version