После нескольких месяцев слухов и спекуляций OpenAI анонсировала GPT-4 — новую языковую модель ИИ. Компания утверждает, что модель «более творческая и больше предназначена для совместно работы, чем когда-либо прежде» и «может решать сложные проблемы с большей точностью». Модель может анализировать как текст, так и изображения, хотя может отвечать только текстом. OpenAI также предупреждает, что система сохраняет многие из проблем ранних языковых моделей, в том числе тенденцию выдумывать информацию (или «галлюцинировать») и способность генерировать агрессивный и вредоносный текст.
OpenAI заявляет, что уже сотрудничает с рядом компаний для интеграции GPT-4 в свои продукты, включая Duolingo, Stripe и Khan Academy. Новая модель доступна для широкой публики через ChatGPT Plus, ежемесячную подписку OpenAI ChatGPT за 20 долларов, и используется для чат-бота в Microsoft Bing. Она также будет доступна как API для разработчиков (есть список ожидания, который, по словам OpenAI, начнет принимать пользователей уже сегодня).
В сообщении в блоге OpenAI говорится, что различие между GPT-4 и его предшественником GPT-3.5 «трудно уловимо» в обычном разговоре (GPT-3.5 — это модель, на которой работает ChatGPT). Генеральный директор OpenAI Сэм Альтман написал в Твиттере, что GPT-4 «все еще несовершенен, все еще ограничен», но также «все еще кажется более впечатляющим при первом использовании, чем после того, как вы проведете с ним больше времени».
Компания заявляет, что улучшения GPT-4 очевидны в производительности системы по ряду тестов и бенчмарков, включая экзамены Uniform Bar Exam, LSAT, SAT Math и SAT Evidence-Based Reading & Writing. На упомянутых экзаменах GPT-4 набрал 88-й процентиль и выше, а полный список экзаменов и тестов, которые прошел ИИ, можно увидеть здесь.
Предположения о GPT-4 и его возможностях распространялись в прошлом году, и многие предполагали, что это будет огромный скачок по сравнению с предыдущими системами. Однако, судя по объявлению OpenAI, улучшение носит более итеративный характер, как ранее предупреждала компания.
«Люди хотят разочароваться, и они будут», — сказал Альтман в интервью о GPT-4 в январе. «У нас нет настоящего ОИИ, но это то, чего от нас ждут».
Путь к GPT-4 был долгим, поскольку OpenAI и языковые модели ИИ в целом медленно набирали обороты в течение нескольких лет, прежде чем в последние месяцы перешли к массовым релизам. Первоначальная исследовательская работа, описывающая GPT, была опубликована в 2018 году, при этом GPT-2 был анонсирован в 2019 году, а GPT-3 — в 2020 году. Эти модели обучаются на огромных наборах данных текста, большая часть которых взята из Интернета, который используется для создания статистических закономерностей. Затем шаблоны используются для предсказания того, какое слово следует за другим. Это относительно простой механизм для описания, но конечным результатом являются гибкие системы, которые могут генерировать, обобщать и перефразировать тексты, а также выполнять другие текстовые задачи, такие как перевод или генерация кода.
Первоначально OpenAI отложила выпуск своих моделей GPT, опасаясь, что они будут использоваться в злонамеренных целях, таких как спам и дезинформация. Но в конце 2022 года компания запустила ChatGPT — диалогового чат-бота на основе GPT-3.5, к которому мог получить доступ любой желающий. Запуск ChatGPT вызвал ажиотаж в мире технологий, и Microsoft вскоре последовала за ним со своим чатботом Bing (часть поисковой системы Bing), а Google изо всех сил пытается наверстать упущенное.