#OpenAI #Искусственный Интеллект #чат-боты

GPT-4o стал лидером по программированию на Solidity

21.10.2024 Владимир Слипер

ИИ-модель GPT-4o от OpenAI набрала наивысший балл в рейтинге по программированию на языке Solidity, обойдя o1-preview, o1-mini и конкурентов. Об этом свидетельствуют данные исследования BrainDAO.

Рейтинг ИИ-моделей в выполнении заданий по программированию на Solidity. Данные: Hugging Face.

В пятерке лидеров:

GPT-4o — 80,05 балла;
o1-preview — 77,61;
o1-mini — 75,08;
Claude 3.5 — 74,88;
Grok-2 — 74,64.

Для анализа и составления рейтинга SolidityBench применялись два бенчмарка NaïveJudge и HumanEval, разработанных для оценки и ранжирования мастерства ИИ-моделей в генерации кода для смарт-контрактов.

Код от нейросетей оценивался на основе «строгих критериев» вроде реализации ключевых функций, обработки крайних случаев, работы с ошибками, правильного использования синтаксиса, общей структуры и поддерживаемости. Также анализировалась эффективность использования газа и управление хранением.

Диапазон баллов варьируется от 0 до 100, обеспечивая комплексную оценку функциональности, безопасности и эффективности.

Ранее Meta разработала ИИ-инструмент CodeCompose для генерации программного кода.

Напомним, в сентябре Google выпустила две обновленные версии моделей Gemini 1.5, которые продемонстрировали улучшения в работе с языками программирования.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Сбой в работе роботакси Apollo Go привел к авариям на дорогах

Инвесторы оценили OpenAI в $852 млрд перед запуском универсального ИИ-супераппа

Масштабная утечка исходного кода Claude Code раскрыла десятки скрытых функций Anthropic

СМИ: Oracle уволит тысячи сотрудников из-за ИИ

Биткоин-майнер Bitfarms проведет ребрендинг на фоне перехода в ИИ

ИИ-агент пожаловался на бан от «Википедии»

Microsoft объединила GPT и Claude для коллективной работы

ИИ-сервис от Bluesky оказался в топе по блокировкам на платформе

Ученые создали «нейрошлем» для управления собакой-роботом