Турбо-версии GPT и ассистент для разработчиков — презентация OpenAI
- В OpenAI представили ускоренные версии нейросетей с дополнительными опциями.
- API Assistants помогает разработчикам в написании кода и выполнении других задач.
- GPTs — микро-расширения для ChatGPT.
Глава компании OpenAI Сэм Альтман провел презентацию в рамках конференции DevDay, на которой рассказал о предстоящих обновлениях чат-бота ChatGPT и новых инструментах для разработчиков.
Турбо-режим
В первую очередь команда представила улучшенную версию GPT-4 Turbo с расширенным объемом контекстного окна в 128 000 токенов. Это значение эквивалентно 300 страниц текста за один запрос.
Искусственный интеллект более функционален и обладает знаниями о мировых событиях до апреля 2023 года.
Чат-бот получил обновленную систему вызова функций, которая позволяет создать запрос на два действия одновременно, например «открыть окно автомобиля и выключить кондиционер». Усовершенствованный API для нейросети запоминает и «с большей вероятностью» воспроизводит правильные параметры функций.
Кроме того, GPT-4 Turbo научили тщательно следовать запрошенному формату при указании специального параметра (например, «всегда отвечать в XML»). Нейросеть также поддерживает режим JSON для компоновки полученных результатов.
Новый параметр — seed — обеспечивает воспроизводимость выходных данных, заставляя нейросеть повторять согласованные результаты. Бета-функция, которая обеспечивает больший контроль над поведением модели, полезна для создания нескольких запросов на отладку и комплексных модульных тестов.
В дополнение OpenAI выпустила турбо-версию GPT-3.5 с контекстным окном на 16 000 токенов. Нейросеть поддерживает аналогичную GPT-4 Turbo функциональность, но в более медленном режиме.
Полезный ассистент
API Assistants — специально созданный ИИ, который имеет конкретные инструкции, использует дополнительные знания и может вызывать модели и инструменты для выполнения задач.
Интерфейс помощника предоставляет возможности интерпретатора и извлечения кода на Python. Инструмент также умеет исполнять некоторые функции, которые раньше приходилось прописывать вручную, и позволяет создавать «высококачественные приложения искусственного интеллекта».
«API разработан с учетом гибкости: варианты использования варьируются от приложения для анализа данных на естественном языке, помощника по программированию, планировщика отпуска на базе ИИ, диджея с голосовым управлением, интеллектуального визуального холста — список можно продолжать долго», — подчеркнули в OpenAI.
Дополнительные возможности
Расширенная функциональность, которую получили турбо-версии GPT, дает возможность реализовывать дополнительные решения. Например, API Chat Completions позволяет ИИ воспринимать изображения в качество входных данных, за счет чего нейросеть может создавать подписи к рисункам, делать подробный анализ фотографий или читать, а затем пересказывать документы.
Благодаря «зрению» ChatGPT появилось приложение BeMyEyes, которое использует расширение для помощи слепым и слабовидящим людям в выполнении повседневных задач вроде навигации в помещении.
Теперь разработчики могут интегрировать генеративную нейросеть DALL-E 3 в свои продукты напрямую через интерфейс. Инструмент имеет встроенную модерацию выходного контента для борьбы с нарушением авторских прав.
Кроме того, продукты OpenAI получили полноценную поддержку функции по преобразованию текста в речь и имеют шесть предустановленных голосов. Расширение обладает различными режимами, например для беседы в реальном времени или создания звуковой дорожки высокого качества.
Для тех, кому недостаточно обычного функционала ChatGPT, добавили экспериментальную возможность «тонкой настройки» и инструмент Custom Models. Это позволит изменять код языковой модели на любом этапе, начиная с обучения.
Напоследок OpenAI представила кастомные узконаправленные версии нейросети — GPTs. Они представляют собой нечто похожее на расширения для веб-браузера.
Некоторые могут выполнять конкретные задачи по поиску информации в интернете или служить виртуальным помощником в рабочих процессах.
Согласно заявлению компанию, для создания GPTs не требуется написание кода. Инструмент можно сделать лично для себя, корпоративного использования или выложить его в общий доступ.
Специальный магазин расширений появится позднее в ноябре. Сторонние пользователи смогут добавлять свои разработки на платформу, лучше из них выберет команда OpenAI.
Напомним, в конце сентября разработчики выпустили масштабное обновление для ChatGPT. Чат-бот впервые научился «видеть, слышать и говорить».
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!