Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

ForkLog — культовый журнал о биткоине, технологии блокчейн и цифровой экономике. Ежедневно поставляем новости и аналитику по рынку криптовалют с 2014 года.Все опубликованные материалы принадлежат ForkLog. Вы можете перепечатывать наши материалы только после согласования с редакцией и с указанием активной ссылки на ForkLog.

Claude 3 Opus превзошла GPT-4 по оценкам пользователей

Чат-боты с искусственным интеллектом
Чат-боты с искусственным интеллектом

ИИ-модель Claude 3 Opus от компании Anthropic впервые превзошла GPT-4 на Chatbot Arena.


«Король мертв. Покойся с миром GPT-4», — написал разработчик программного обеспечения Ник Добос.

Chatbot Arena используется исследователями нейросетей для оценки возможностей чат-ботов. GPT-4 добавлен на платформу в мае 2023 года, его вариации занимали лидирующие позиции до 26 марта 2024 года пока не уступили Claude 3. Согласно данным арены, одна из небольших моделей Anthropic — Haiku также показывает хорошие результаты.

«Впервые лучшие из доступных моделей представлены не OpenAI. Opus наиболее подходящая модель для сложных задач, а Haiku сочетает в себе баланс экономичности и эффективности», — сообщил исследователь ИИ Саймон Уиллисон.

100x

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Chatbot Arena управляется организацией Large Model Systems Organization, которая занимается исследованиями в области открытых моделей. Она сотрудничает со студентами и преподавателями Университета Калифорнии в Беркли, Университета Калифорнии в Сан-Диего и Университета Карнеги-Меллон.

Особенность платформы в отсутствии объективных критериев оценки. При посещении сайта пользователь видит поле для ввода данных и два окна с результатами работы необозначенных ИИ-моделей. Основная задача — решить, какой результат кажется лучшим, основываясь на личных предпочтениях.

Благодаря такому подходу Chatbot Arena определяет лидеров и регулярно обновляет таблицу, отражая полученные результаты.

Ранее компания Amazon увеличила объем инвестиций в Anthropic до $4 млрд.

Напомним, в марте ИИ-стартап представил чат-бота Claude 3, оказавшегося самым быстрым и мощным среди всех конкурентов по результатам тестов компании.

Подписывайтесь на ForkLog в социальных сетях

Telegram (AI) Discord Instagram
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER
*Ежедневная рассылка — краткая сводка наиболее важных новостей предыдущего дня. Чтение занимает не больше двух минут. Выходит в рабочие дни в 06:00 (UTC)
*Еженедельная рассылка — объясняем, кто и как изменил индустрию за неделю. Идеально подходит для тех, кто не успевает за новостным потоком в течение дня. Выходит в пятницу в 16:00 (UTC).

Мы используем файлы cookie для улучшения качества работы.

Пользуясь сайтом, вы соглашаетесь с Политикой приватности.

OK