Обзор нейросети GPT-4 от OpenAI: что умеет и чем отличается от предшественников

28.03.2023 nts

14 марта 2023 года ИИ-лаборатория OpenAI представила большую мультимодальную нейросеть GPT-4. Сразу после релиза разработчики открыли к ней доступ подписчикам ChatGPT Plus с некоторыми ограничениями.

Редакция ForkLog протестировала нейросеть, выяснила ее возможности и сравнила с алгоритмом GPT-3.5.

GPT-4 доступен подписчикам ChatGPT Plus и пользователям чата обновленного Bing.
Четвертая версия алгоритма способна принимать на вход подсказку и изображения, выдавая текстовый результат.
Нейросеть может изображать выбранную роль, говорить в определенном тоне и помогать в решении различных задач.
В непринужденной беседе отличий в общении с GPT-3.5 и GPT-4 практически нет.

Что такое GPT-4 и как с ним поговорить

Это четвертое поколение модели обработки естественного языка от OpenAI. По словам разработчиков, в сравнении с GPT-3.5 новый алгоритм надежнее, креативнее и быстрее выполняет работу с инструкциями.

Объявление о доступности GPT-4 при запуске ChatGPT Plus. Данные: ChatGPT.

Компания поделилась результатами множества тестов нейросети, а также показала несколько демонстраций ее работы.

Однако ИИ-лаборатория не предоставила сведений об обучающих данных, используемых для создания модели методах, оборудовании или энергозатратах при тренировке.

GPT-4 рассказывает о себе. Данные: ChatGPT.

Если спросить об этом алгоритм, он выдаст размытую информацию без конкретизации, актуальную также для GPT-3.5.

Ответ GPT-4 об используемых разработчиками данных, методах и оборудовании при ее создании. Данные: ChatGPT.

Нейросеть доступна во всех странах, кроме Афганистана, Беларуси, Венесуэлы, Ирана, Китая и России.

В феврале стало известно, что Украину исключили из списка государств, в которых заблокированы сервисы OpenAI. Однако алгоритмы компании не работают на временно оккупированных Россией территориях.

Пользователи из регионов, где технология недоступна, смогут использовать GPT-4 только при наличии VPN-сервиса и активного номера телефона из открытого для нейросети государства.

Чтобы пообщаться с алгоритмом, необходимо приобрести подписку ChatGPT Plus стоимостью $20. Затем вверху страницы чата кликнуть на поле Model и выбрать GPT-4.

Как выбрать GPT-4 в чате ChatGPT Plus. Данные: ChatGPT.

В марте 2023 года Microsoft подтвердила, что обновленный Bing работает на оптимизированной версии GPT-4. Позже компания также удалила список ожидания для ИИ-чата, предоставив возможность всем желающим использовать улучшенный режим поиска.

К тому же, алгоритм Bing обладает знаниями, выходящими за рамки «до сентября 2021 года», и в общении использует актуальные данные.

GPT-4, как и его предшественник, дает развернутые ответы на вопросы.

На момент публикации статьи скорость создания текста осталась низкой: бот пишет около двух-трех слов в секунду.

21 марта после масштабного сбоя разработчики ввели ограничение в 25 генераций текста в течение трех часов. До этого разрешалось использовать 100 сообщений каждые четыре часа.

Выяснилось, что OpenAI временно приостановила работу ChatGPT после сообщений об ошибке, позволяющей некоторым пользователям видеть заголовки диалогов в истории чатов других людей.

Глава компании Сэм Альтман заявил, что разработчики «чувствуют себя ужасно» из-за этого.

we had a significant issue in ChatGPT due to a bug in an open source library, for which a fix has now been released and we have just finished validating.

a small percentage of users were able to see the titles of other users’ conversation history.

we feel awful about this.
— Sam Altman (@sama) March 22, 2023

Возможности алгоритма

Главное отличие четвертой версии GPT от предшественников — мультимодальность. Она может принимать на вход подсказку и изображения, выдавая результат в виде текста.

GPT-4 описывает, что видит на картинке. Данные: OpenAI.

Также нейросеть способна «рассуждать» на основе графических данных.

GPT-4 объясняет смысл мема. Данные: OpenAI.

Однако обработка картинок пока недоступна в ChatGPT Plus.

Ответ GPT-4 на вопрос про возможность обрабатывать изображения. Данные: ChatGPT.

В компании отметили, что помимо мультимодальности алгоритм научился обрабатывать более 25 000 слов. Для сравнения, GPT-3.5 могла генерировать только 3000 слов.

Такое увеличение объема текста позволяет создавать длинный контент и анализировать большие документы.

По словам разработчиков, GPT-4 может решить «сложные проблемы с большей осознанностью благодаря более тонким знаниям и возможностям».

«Новая модель менее эффективна, чем люди, однако во многих реальных сценариях демонстрирует производительность на уровне человека», — говорится на сайте OpenAI.

Алгоритм способен по запросу пользователя принимать ту или иную роль. Его можно попросить стать юристом или репетитором. В таком случае система будет точнее обрабатывать запросы, связанные с конкретной областью знаний.

Что такое ChatGPT и как им пользоваться?

Мы попросили GPT-4 представить себя юристом и помочь подать жалобу в Общество по защите прав потребителей в связи с покупкой просроченного йогурта. Вымышленная ситуация предполагала отказ менеджера супермаркета «Колбаса» принимать обратно товар и возвращать деньги.

Алгоритм порекомендовал выполнить ряд определенных действий.

GPT-4 в роли юриста дает рекомендации для подачи жалобы в Общество по защите прав потребителей. Данные: ChatGPT.

Модель может прикинуться RPG-героем, репортером или кем-то еще.

GPT-4 в роли журналиста ведет репортаж с места, где обнаружили миграцию единорогов. Данные: ChatGPT.

Также нейросеть способна в стиле выбранного персонажа объяснять различные понятия.

GPT-4 в роли капитана Джека Спарроу объясняет теорию относительности. Данные: ChatGPT.

GPT-4 по запросу может изменить характер общения и отвечать с выбранной пользователем эмоцией. Например, обиженно.

«Обиженные» ответы GPT-4. Данные: ChatGPT.

В компании заявили, что модель очень творческая и коллаборативная. Она может генерировать, редактировать и повторять за пользователем различные задачи по письму, включая сочинение песен, создание сценариев и изучение определенного языкового стиля.

Мы попросили алгоритм зарифмовать «Сказку о трех братьях» из серии книг о Гарри Поттере, а затем сократить результат и сделать его «повеселее». Нейросеть выполнила запросы.

GPT-4 рассказал «Сказку о трех братьях».

Если попросить GPT-4 помочь в создании приложения или веб-сервиса, система предоставит пошаговые инструкции для реализации задачи.

Также алгоритм может сгенерировать код простой игры на выбранном языке программирования. Например, основатель стартапа neural.love Денис Ширяев с помощью модели разработал 2D-аркаду на JavaScript по описанию из копипасты «Корованы».

В результате нейросеть создала игру, где управляя зеленой точкой, можно стрелять в караван, состоящий из верблюда, слона и лошади.

Ширяев разместил ее в открытом доступе на сайте CodePen.

Созданная GPT-4 2D-игра. Данные: Денис Ширяев.

GPT-4 умеет создавать ASCII-изображения. Бот не способен генерировать сложные картинки, а только упрощенные «зарисовки».

ASCII-изображение робота, созданное GPT-4. Данные: ChatGPT.

Однако интегрированный в ChatGPT алгоритм ограничен знаниями до сентября 2021 года. Поэтому не получится узнать прогноз погоды на завтра в Киеве, подробности о вышедшем в 2023 году сериале «Одни из нас» или жива ли королева Великобритании Елизавета II.

Ответ GPT-4 про популярные в 2023 году сериалы. Данные: ChatGPT.

24 марта OpenAI добавила в ChatGPT поддержку сторонних плагинов. Они позволят чат-боту просматривать актуальные веб-данные и взаимодействовать с конкретными сайтами.

Компания уже интегрировала 11 плагинов, включая Expedia, OpenTable и Wolfram.

Плагины, доступные в ChatGPT. Данные: OpenAI.

Также инженеры добавили два плагина собственной разработки: интерпретатор кода и веб-браузер. Последний может искать информацию в интернете и предоставлять ссылки на используемые источники.

В OpenAI сообщили, что изначально испытать новую возможность сможет небольшое количество избранных разработчиков и пользователей ChatGPT Plus из списка ожидания.

Чем GPT-4 отличается от GPT-3.5

По словам разработчиков, в непринужденной беседе отличий в общении с GPT-3.5 и GPT-4 практически нет. Разница заметна, когда сложность задачи достигает определенного порога.

Чтобы показать отличия между алгоритмами, инженеры OpenAI провели различные тесты. Они использовали общедоступные олимпиадные задачи и платные практические экзамены за 2022–2023 год.

Разработчики заявили, что перед тестированием никак не подготавливали алгоритмы. Согласно результатам, GPT-4 оказалась эффективнее GPT-3.5.

Результаты экзаменов GPT-3.5 и GPT-4. Данные: OpenAI.

Также четвертая версия алгоритма превзошла своего предшественника в традиционных тестах, разработанных для ИИ-систем. Выяснилось, что GPT-4 значительно эффективнее существующих языковых моделей.

Результаты бенчмарка ИИ-задач. Данные: OpenAI.

Мы также предложили GPT-3.5 и GPT-4 решить некоторые задачи и сравнили их ответы.

Первая головоломка называется «Во время прилива». Для ее решения необходимо согласно предоставленным условиям рассчитать, сколько пройдет времени, прежде чем вода покроет третью ступеньку веревочной лестницы корабля во время прилива.

GPT-3.5 ответила, что это займет два часа, а GPT-4 — четыре.

Однако, когда задача касается какого-либо физического явления, то нужно учитывать все переменные. В данном случае логика задания подразумевает, что одновременно с увеличением уровня воды корабль также будет подниматься. Соответственно, лестница по отношению к ватерлинии не изменит своего положения.

Решение GPT-4 задачи «Во время прилива».

Если указать на логику задачи алгоритмам, можно получить корректный ответ.

Ответ GPT-4 на уточнение по решению задачи «Во время прилива».

Затем моделям необходимо было сделать короткую выжимку основных событий по книге «Лев, Колдунья и Платяной шкаф» писателя Клайва Льюиса и сформировать короткий и связный рассказ.

Созданная GPT-4 короткая выжимка основных событий по книге «Лев, Колдунья и Платяной шкаф».

После этого мы попросили GPT-4 и GPT-3.5 написать программный код на языке JavaScript для подключения к базе данных MongoDB, создания пользователя, внесения его в базу и регистрации. Обе модели выдали подробные инструкции.

GPT-4 забыл сгенерировать код для регистрации пользователя, но исправился после подсказки.

GPT-4 сгенерировал JavaScript-код для подключения к базе данных MongoDB, создания пользователя, внесения его в базу и регистрации. Данные: ChatGPT.

GPT-3.5 предложил менее надежный метод. Например, алгоритм указал поиск по паролю, что не имеет смысла. Также его код для регистрации не включал проверку того, находился ли пользователь уже в базе или нет.

К тому же, GPT-3.5 не хэшировал пароль и даже не предупредил об этом.

GPT-3.5 сгенерировал JavaScript-код для подключения к базе данных MongoDB, создания пользователя, внесения его в базу и регистрации. Данные: ChatGPT.

Если попросить нейросети объяснить понятие «период полураспада» десятилетнему ребенку, то они сгенерируют не совсем простые для понимания ответы. Однако, используя подсказки, можно достичь релевантного результата.

Объяснения GPT-4 понятия «период полураспада».

Еще мы попросили алгоритмы придумать шутку про корень мандрагоры из книг о Гарри Поттере.

Придуманная GPT-4 шутка про корень мандрагоры.

Также мы задали алгоритмам странную задачу — создать из букв Мону Лизу. Ответ GPT-3.5 оказался оригинальнее.

Ответ GPT-4 на запрос создать из букв Мону Лизу.

Вывод

Когда в июне 2020 года компания OpenAI представила GPT-3, нейросеть произвела фурор в мире искусственного интеллекта. На тот момент она была самой крупной и продвинутой языковой моделью.

Однако время и технологии не стоят на месте. После GPT-3 появилась улучшенная нейросеть GPT-3.5, а затем — еще более продвинутая GPT-4.

Согласно исследованию Microsoft, четвертая версия модели демонстрирует «искры» интеллекта человеческого уровня или сильного ИИ.

Однако при первом знакомстве с GPT-4 и общении на обыденные темы сложно заметить ее превосходство над GPT-3.5.

Ощущается только разница в скорости создания текста. Так как новая версия нейросети пишет весьма развернутые ответы, это может занять продолжительное время.

К тому же, нельзя не учесть ограниченность знаний «до сентября 2021 года». Но тот же Bing на базе GPT-4 устраняет эту проблему.

В сложных вопросах и при обработке больших документов новая модель явно превосходит предшественников. Также можно заметить и ее «усиленную» креативность.

Еще интересно опробовать модель в обработке изображений. Вероятно, в ближайшем будущем OpenAI добавит эту возможность в ChatGPT Plus.

OpenAI также пока не выпустила API-версию GPT-4, но открыла список ожидания.

После анонса многие компании захотели внедрить технологию в свои сервисы. Microsoft уже использует ее в чате Bing, GitHub Copilot, 365 Copilot и DAX Express.

Сервис Duolingo также применил новый ИИ для изучения иностранных языков. GPT-4 будет объяснять пользователям ответы и играть в ролевые игры.

В любом случае, общение с ИИ — интересный опыт. Технология определенно меняет способы взаимодействия с привычными сервисами, расширяет возможности и упрощает пользовательский опыт.

Зачем писать «скучный» доклад, если можно попросить нейросеть? Однако стоит учесть перевирание фактов и плагиат. Любой ИИ не лишен этих дефектов, поэтому требует надзора со стороны людей.

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X

Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Материалы по теме

Anthropic случайно удалил тысячи репозиториев на GitHub из-за слива кода Claude Code

Сбой в работе роботакси Apollo Go привел к авариям на дорогах

Инвесторы оценили OpenAI в $852 млрд перед запуском универсального ИИ-супераппа

Масштабная утечка исходного кода Claude Code раскрыла десятки скрытых функций Anthropic

СМИ: Oracle уволит тысячи сотрудников из-за ИИ

Биткоин-майнер Bitfarms проведет ребрендинг на фоне перехода в ИИ

ИИ-агент пожаловался на бан от «Википедии»

Microsoft объединила GPT и Claude для коллективной работы

ИИ-сервис от Bluesky оказался в топе по блокировкам на платформе