Alibaba выпустила новую ИИ-модель Qwen2

Китайский техгигант Alibaba объявил о выпуске новой модели искусственного интеллекта Qwen2. 

Она разработана Alibaba Cloud и является следующим поколением Tongyi Qianwen (Qwen). В нее входят Tongyi Qianwen LLM (или Qwen), Qwen-VL и Qwen-Audio.

Семейство Qwen2 включает серию из пяти моделей размером от 0,5 до 72 млрд параметров, которые обучены с использованием данных из разных отраслей на 27 языках.

Сравнение ИИ-моделей Qwen2-серии от Alibaba. Данные: сайт Qwen.

Queen2-72B — самая мощная модель в серии, обученная на 3 трлн токенов. Для сравнения, показатель Llama-2 от Meta составляет 2 трлн токенов, Llama-3 — 15 трлн токенов.

Qwen2 может обрабатывать длинный диалоговый контекст — до 128 000 токенов, что сопоставимо с GPT-4o от OpenAI. Команда утверждает, что их модель превосходит LLama3 от Meta практически во всех наиболее важных синтетических тестах.

Сравнение Queen2-72B с конкурентами. Данные: сайт Qwen.

Независимая платформа Elo Arena оценивает Qwen2-72B-Instruct немного лучше GPT-4-0314, но хуже Llama3 70B и GPT-4-0125-preview. 

«По сравнению с современными языковыми моделями с открытым исходным кодом, включая ранее выпущенную Qwen1,5, Qwen2 превзошла большинство моделей и продемонстрировала конкурентоспособность в ряде тестов, нацеленных на понимание языка, генерацию языка, многоязычность, программирование, математику и мышление», — заявила команда Qwen.

Модели Qwen2 демонстрируют хорошее понимание длинных контекстов. Qwen2-72B-Instruct может без ошибок выполнять задачи по извлечению информации в любом месте и почти идеально прошла тест «Иголка в стоге сена». Часто производительность разных моделей начинает ухудшаться по мере взаимодействия с ней.

Тест «Иголка в стоге сена». Данные: сайт Qwen.

Ранее Alibaba анонсировал выпуск чат-бота с искусственным интеллектом Tongyi Qianwen. 

Напомним, в апреле Meta объявила о запуске бесплатного ИИ-ассистента Meta AI на платформах WhatsApp, Instagram, Facebook и Messenger. Он создан на основе языковой модели Llama 3.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK
Exit mobile version