Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель

Science_AI
Science_AI

Китайский ИИ-стартап DeepSeek представил собственную большую языковую модель, которая превзошла по тестам конкурентов от Meta и OpenAI.

DeepSeek V3 имеет 671 млрд параметров. Для сравнения, у Llama 3.1 405B показатель 405 млрд. Число отражает способность ИИ адаптироваться к более сложным вариантам применения и давать ответы точнее.  

Мощнее Meta и OpenAI: китайский стартап DeepSeek представил ИИ-модель
Сравнение DeepSeek V3 с конкурентами. Данные: DeepSeek.

Компания из Ханчжоу обучила нейросеть за два месяца и $5,58 млн, используя значительно меньше вычислительных ресурсов (2048 графических процессоров) по сравнению с более крупными технологическими компаниями. Она обещает предоставление лучшего соотношения цена/качество на рынке.

В будущем запланировано добавление мультимодальности и «других передовых функций».

Член команды OpenAI Андрей Карпати отметил, что DeepSeek продемонстрировала весьма впечатляющие исследования и разработки в условиях ограниченных ресурсов.

«Означает ли это, что вам не нужны большие кластеры GPU для пограничных LLM? Нет, но вы должны быть уверены, что не растрачиваете то, что у вас есть. Это выглядит как хорошая демонстрация того, что еще многое предстоит сделать как с данными, так и с алгоритмами», — добавил он.

Ранее DeepSeek представила «конкурента o1 от OpenAI» — думающую «сверхмощную» ИИ-модель DeepSeek-R1-Lite-Preview.

Напомним, в июле китайская компания Kuaishou открыла ИИ-модель для генерации видео Kling для всех желающих.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK