Alibaba выпустила новую ИИ-модель Qwen2

10.06.2024 ForkLog

Китайский техгигант Alibaba объявил о выпуске новой модели искусственного интеллекта Qwen2.

Она разработана Alibaba Cloud и является следующим поколением Tongyi Qianwen (Qwen). В нее входят Tongyi Qianwen LLM (или Qwen), Qwen-VL и Qwen-Audio.

Семейство Qwen2 включает серию из пяти моделей размером от 0,5 до 72 млрд параметров, которые обучены с использованием данных из разных отраслей на 27 языках.

Сравнение ИИ-моделей Qwen2-серии от Alibaba. Данные: сайт Qwen.

Queen2-72B — самая мощная модель в серии, обученная на 3 трлн токенов. Для сравнения, показатель Llama-2 от Meta составляет 2 трлн токенов, Llama-3 — 15 трлн токенов.

Qwen2 может обрабатывать длинный диалоговый контекст — до 128 000 токенов, что сопоставимо с GPT-4o от OpenAI. Команда утверждает, что их модель превосходит LLama3 от Meta практически во всех наиболее важных синтетических тестах.

Сравнение Queen2-72B с конкурентами. Данные: сайт Qwen.

Независимая платформа Elo Arena оценивает Qwen2-72B-Instruct немного лучше GPT-4-0314, но хуже Llama3 70B и GPT-4-0125-preview.

«По сравнению с современными языковыми моделями с открытым исходным кодом, включая ранее выпущенную Qwen1,5, Qwen2 превзошла большинство моделей и продемонстрировала конкурентоспособность в ряде тестов, нацеленных на понимание языка, генерацию языка, многоязычность, программирование, математику и мышление», — заявила команда Qwen.

Модели Qwen2 демонстрируют хорошее понимание длинных контекстов. Qwen2-72B-Instruct может без ошибок выполнять задачи по извлечению информации в любом месте и почти идеально прошла тест «Иголка в стоге сена». Часто производительность разных моделей начинает ухудшаться по мере взаимодействия с ней.

Тест «Иголка в стоге сена». Данные: сайт Qwen.

Ранее Alibaba анонсировал выпуск чат-бота с искусственным интеллектом Tongyi Qianwen.

Напомним, в апреле Meta объявила о запуске бесплатного ИИ-ассистента Meta AI на платформах WhatsApp, Instagram, Facebook и Messenger. Он создан на основе языковой модели Llama 3.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Инвесторы оценили OpenAI в $852 млрд перед запуском универсального ИИ-супераппа

Масштабная утечка исходного кода Claude Code раскрыла десятки скрытых функций Anthropic

СМИ: Oracle уволит тысячи сотрудников из-за ИИ

Биткоин-майнер Bitfarms проведет ребрендинг на фоне перехода в ИИ

ИИ-агент пожаловался на бан от «Википедии»

Microsoft объединила GPT и Claude для коллективной работы

ИИ-сервис от Bluesky оказался в топе по блокировкам на платформе

Ученые создали «нейрошлем» для управления собакой-роботом

Эксперты спрогнозировали скорый прорыв нейроинтерфейсов в Китае