Обзор нейросети GPT-4 от OpenAI: что умеет и чем отличается от предшественников
14 марта 2023 года ИИ-лаборатория OpenAI представила большую мультимодальную нейросеть GPT-4. Сразу после релиза разработчики открыли к ней доступ подписчикам ChatGPT Plus с некоторыми ограничениями.
Редакция ForkLog протестировала нейросеть, выяснила ее возможности и сравнила с алгоритмом GPT-3.5.
- GPT-4 доступен подписчикам ChatGPT Plus и пользователям чата обновленного Bing.
- Четвертая версия алгоритма способна принимать на вход подсказку и изображения, выдавая текстовый результат.
- Нейросеть может изображать выбранную роль, говорить в определенном тоне и помогать в решении различных задач.
- В непринужденной беседе отличий в общении с GPT-3.5 и GPT-4 практически нет.
Что такое GPT-4 и как с ним поговорить
Это четвертое поколение модели обработки естественного языка от OpenAI. По словам разработчиков, в сравнении с GPT-3.5 новый алгоритм надежнее, креативнее и быстрее выполняет работу с инструкциями.
Компания поделилась результатами множества тестов нейросети, а также показала несколько демонстраций ее работы.
Однако ИИ-лаборатория не предоставила сведений об обучающих данных, используемых для создания модели методах, оборудовании или энергозатратах при тренировке.
Если спросить об этом алгоритм, он выдаст размытую информацию без конкретизации, актуальную также для GPT-3.5.
Нейросеть доступна во всех странах, кроме Афганистана, Беларуси, Венесуэлы, Ирана, Китая и России.
В феврале стало известно, что Украину исключили из списка государств, в которых заблокированы сервисы OpenAI. Однако алгоритмы компании не работают на временно оккупированных Россией территориях.
Пользователи из регионов, где технология недоступна, смогут использовать GPT-4 только при наличии VPN-сервиса и активного номера телефона из открытого для нейросети государства.
Чтобы пообщаться с алгоритмом, необходимо приобрести подписку ChatGPT Plus стоимостью $20. Затем вверху страницы чата кликнуть на поле Model и выбрать GPT-4.
В марте 2023 года Microsoft подтвердила, что обновленный Bing работает на оптимизированной версии GPT-4. Позже компания также удалила список ожидания для ИИ-чата, предоставив возможность всем желающим использовать улучшенный режим поиска.
К тому же, алгоритм Bing обладает знаниями, выходящими за рамки «до сентября 2021 года», и в общении использует актуальные данные.
GPT-4, как и его предшественник, дает развернутые ответы на вопросы.
На момент публикации статьи скорость создания текста осталась низкой: бот пишет около двух-трех слов в секунду.
21 марта после масштабного сбоя разработчики ввели ограничение в 25 генераций текста в течение трех часов. До этого разрешалось использовать 100 сообщений каждые четыре часа.
Выяснилось, что OpenAI временно приостановила работу ChatGPT после сообщений об ошибке, позволяющей некоторым пользователям видеть заголовки диалогов в истории чатов других людей.
Глава компании Сэм Альтман заявил, что разработчики «чувствуют себя ужасно» из-за этого.
we had a significant issue in ChatGPT due to a bug in an open source library, for which a fix has now been released and we have just finished validating.
— Sam Altman (@sama) March 22, 2023
a small percentage of users were able to see the titles of other users’ conversation history.
we feel awful about this.
Возможности алгоритма
Главное отличие четвертой версии GPT от предшественников — мультимодальность. Она может принимать на вход подсказку и изображения, выдавая результат в виде текста.
Также нейросеть способна «рассуждать» на основе графических данных.
Однако обработка картинок пока недоступна в ChatGPT Plus.
В компании отметили, что помимо мультимодальности алгоритм научился обрабатывать более 25 000 слов. Для сравнения, GPT-3.5 могла генерировать только 3000 слов.
Такое увеличение объема текста позволяет создавать длинный контент и анализировать большие документы.
По словам разработчиков, GPT-4 может решить «сложные проблемы с большей осознанностью благодаря более тонким знаниям и возможностям».
«Новая модель менее эффективна, чем люди, однако во многих реальных сценариях демонстрирует производительность на уровне человека», — говорится на сайте OpenAI.
Алгоритм способен по запросу пользователя принимать ту или иную роль. Его можно попросить стать юристом или репетитором. В таком случае система будет точнее обрабатывать запросы, связанные с конкретной областью знаний.
Мы попросили GPT-4 представить себя юристом и помочь подать жалобу в Общество по защите прав потребителей в связи с покупкой просроченного йогурта. Вымышленная ситуация предполагала отказ менеджера супермаркета «Колбаса» принимать обратно товар и возвращать деньги.
Алгоритм порекомендовал выполнить ряд определенных действий.
Модель может прикинуться RPG-героем, репортером или кем-то еще.
Также нейросеть способна в стиле выбранного персонажа объяснять различные понятия.
GPT-4 по запросу может изменить характер общения и отвечать с выбранной пользователем эмоцией. Например, обиженно.
В компании заявили, что модель очень творческая и коллаборативная. Она может генерировать, редактировать и повторять за пользователем различные задачи по письму, включая сочинение песен, создание сценариев и изучение определенного языкового стиля.
Мы попросили алгоритм зарифмовать «Сказку о трех братьях» из серии книг о Гарри Поттере, а затем сократить результат и сделать его «повеселее». Нейросеть выполнила запросы.
Если попросить GPT-4 помочь в создании приложения или веб-сервиса, система предоставит пошаговые инструкции для реализации задачи.
Также алгоритм может сгенерировать код простой игры на выбранном языке программирования. Например, основатель стартапа neural.love Денис Ширяев с помощью модели разработал 2D-аркаду на JavaScript по описанию из копипасты «Корованы».
В результате нейросеть создала игру, где управляя зеленой точкой, можно стрелять в караван, состоящий из верблюда, слона и лошади.
Ширяев разместил ее в открытом доступе на сайте CodePen.
GPT-4 умеет создавать ASCII-изображения. Бот не способен генерировать сложные картинки, а только упрощенные «зарисовки».
Однако интегрированный в ChatGPT алгоритм ограничен знаниями до сентября 2021 года. Поэтому не получится узнать прогноз погоды на завтра в Киеве, подробности о вышедшем в 2023 году сериале «Одни из нас» или жива ли королева Великобритании Елизавета II.
24 марта OpenAI добавила в ChatGPT поддержку сторонних плагинов. Они позволят чат-боту просматривать актуальные веб-данные и взаимодействовать с конкретными сайтами.
Компания уже интегрировала 11 плагинов, включая Expedia, OpenTable и Wolfram.
Также инженеры добавили два плагина собственной разработки: интерпретатор кода и веб-браузер. Последний может искать информацию в интернете и предоставлять ссылки на используемые источники.
В OpenAI сообщили, что изначально испытать новую возможность сможет небольшое количество избранных разработчиков и пользователей ChatGPT Plus из списка ожидания.
Чем GPT-4 отличается от GPT-3.5
По словам разработчиков, в непринужденной беседе отличий в общении с GPT-3.5 и GPT-4 практически нет. Разница заметна, когда сложность задачи достигает определенного порога.
Чтобы показать отличия между алгоритмами, инженеры OpenAI провели различные тесты. Они использовали общедоступные олимпиадные задачи и платные практические экзамены за 2022–2023 год.
Разработчики заявили, что перед тестированием никак не подготавливали алгоритмы. Согласно результатам, GPT-4 оказалась эффективнее GPT-3.5.
Также четвертая версия алгоритма превзошла своего предшественника в традиционных тестах, разработанных для ИИ-систем. Выяснилось, что GPT-4 значительно эффективнее существующих языковых моделей.
Мы также предложили GPT-3.5 и GPT-4 решить некоторые задачи и сравнили их ответы.
Первая головоломка называется «Во время прилива». Для ее решения необходимо согласно предоставленным условиям рассчитать, сколько пройдет времени, прежде чем вода покроет третью ступеньку веревочной лестницы корабля во время прилива.
GPT-3.5 ответила, что это займет два часа, а GPT-4 — четыре.
Однако, когда задача касается какого-либо физического явления, то нужно учитывать все переменные. В данном случае логика задания подразумевает, что одновременно с увеличением уровня воды корабль также будет подниматься. Соответственно, лестница по отношению к ватерлинии не изменит своего положения.
Если указать на логику задачи алгоритмам, можно получить корректный ответ.
Затем моделям необходимо было сделать короткую выжимку основных событий по книге «Лев, Колдунья и Платяной шкаф» писателя Клайва Льюиса и сформировать короткий и связный рассказ.
После этого мы попросили GPT-4 и GPT-3.5 написать программный код на языке JavaScript для подключения к базе данных MongoDB, создания пользователя, внесения его в базу и регистрации. Обе модели выдали подробные инструкции.
GPT-4 забыл сгенерировать код для регистрации пользователя, но исправился после подсказки.
GPT-3.5 предложил менее надежный метод. Например, алгоритм указал поиск по паролю, что не имеет смысла. Также его код для регистрации не включал проверку того, находился ли пользователь уже в базе или нет.
К тому же, GPT-3.5 не хэшировал пароль и даже не предупредил об этом.
Если попросить нейросети объяснить понятие «период полураспада» десятилетнему ребенку, то они сгенерируют не совсем простые для понимания ответы. Однако, используя подсказки, можно достичь релевантного результата.
Еще мы попросили алгоритмы придумать шутку про корень мандрагоры из книг о Гарри Поттере.
Также мы задали алгоритмам странную задачу — создать из букв Мону Лизу. Ответ GPT-3.5 оказался оригинальнее.
Вывод
Когда в июне 2020 года компания OpenAI представила GPT-3, нейросеть произвела фурор в мире искусственного интеллекта. На тот момент она была самой крупной и продвинутой языковой моделью.
Однако время и технологии не стоят на месте. После GPT-3 появилась улучшенная нейросеть GPT-3.5, а затем — еще более продвинутая GPT-4.
Согласно исследованию Microsoft, четвертая версия модели демонстрирует «искры» интеллекта человеческого уровня или сильного ИИ.
Однако при первом знакомстве с GPT-4 и общении на обыденные темы сложно заметить ее превосходство над GPT-3.5.
Ощущается только разница в скорости создания текста. Так как новая версия нейросети пишет весьма развернутые ответы, это может занять продолжительное время.
К тому же, нельзя не учесть ограниченность знаний «до сентября 2021 года». Но тот же Bing на базе GPT-4 устраняет эту проблему.
В сложных вопросах и при обработке больших документов новая модель явно превосходит предшественников. Также можно заметить и ее «усиленную» креативность.
Еще интересно опробовать модель в обработке изображений. Вероятно, в ближайшем будущем OpenAI добавит эту возможность в ChatGPT Plus.
OpenAI также пока не выпустила API-версию GPT-4, но открыла список ожидания.
После анонса многие компании захотели внедрить технологию в свои сервисы. Microsoft уже использует ее в чате Bing, GitHub Copilot, 365 Copilot и DAX Express.
Сервис Duolingo также применил новый ИИ для изучения иностранных языков. GPT-4 будет объяснять пользователям ответы и играть в ролевые игры.
В любом случае, общение с ИИ — интересный опыт. Технология определенно меняет способы взаимодействия с привычными сервисами, расширяет возможности и упрощает пользовательский опыт.
Зачем писать «скучный» доклад, если можно попросить нейросеть? Однако стоит учесть перевирание фактов и плагиат. Любой ИИ не лишен этих дефектов, поэтому требует надзора со стороны людей.
Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!