OpenAI выпустила новое приложение Codex для управления агентами

AppTractor

5 месяцев назад

Искусственный интеллект уже оказывает колоссальное влияние на процесс написания программного обеспечения, и большая часть рутинной работы по программированию теперь выполняется роями агентов и субагентов. Но по мере того, как разработчики экспериментируют с новыми интерфейсами и форм-факторами для взаимодействия человека и ИИ, даже самым передовым лабораториям ИИ становится трудно идти в ногу со временем.

Текущая тенденция — это разработка программного обеспечения с использованием агентов — систем, в которых агенты ИИ могут независимо работать над задачами кодирования, — примером чего являются приложения Claude Code и Cowork. Тем временем OpenAI постепенно развивает свой инструмент Codex, который был запущен как инструмент командной строки в апреле прошлого года и через месяц расширился до веб-интерфейса.

Теперь OpenAI делает важный шаг к тому, чтобы наверстать упущенное. В понедельник компания запустила новое macOS-приложение для Codex, интегрирующее многие из методов работы с агентами, которые стали популярными за последний год. Новое приложение предназначено для параллельной работы с несколькими агентами, интегрируя навыки агентов и другие передовые рабочие процессы. Запуск также состоялся менее чем через два месяца после запуска GPT-5.2-Codex, самой мощной модели программирования от OpenAI, которая, как надеется компания, сможет переманить пользователей Claude Code.

«Если вы действительно хотите выполнять сложную работу над чем-то комплексным, 5.2 — это, безусловно, самая сильная модель», — заявил генеральный директор Сэм Альтман журналистам во время пресс-конференции. «Однако ею сложнее пользоваться, поэтому мы считаем, что перенос такого уровня возможностей модели в более гибкий интерфейс будет иметь большое значение».

Хотя уверенность Альтмана в GPT-5.2 понятна, результаты тестов говорят о более сложной истории. GPT-5.2 действительно занимает первое место в TerminalBench (тест, измеряющий, насколько хорошо ИИ справляется с задачами программирования из командной строки), по крайней мере, на момент публикации. Но агенты из Gemini 3 и Claude Opus показали примерно одинаковые результаты — ниже, но в пределах погрешности теста. Результаты SWE-bench, еще одного теста производительности ИИ, проверяющего способность системы исправлять реальные программные ошибки, схожи и не показывают явного преимущества GPT-5.2. Однако эффективно оценить возможности использования агентных систем оказалось сложно, а современные модели могут значительно различаться по удобству использования.

Приложение Codex также включает в себя ряд новых функций, которые, по словам OpenAI, помогут достичь паритета или, в некоторых случаях, превзойти различные приложения Claude. Приложение Codex позволит создавать автоматизации, которые можно настроить на автоматическое выполнение в фоновом режиме по расписанию, а результаты будут помещены в очередь для просмотра по возвращении пользователя. Пользователи также могут выбирать разные типы личности для агента — от прагматичного до эмпатичного — в зависимости от своего стиля работы.

Но для компании самым большим преимуществом является невероятная скорость разработки, которую обеспечивает ИИ. «Вы можете начать с чистого листа, с нуля, и за несколько часов создать действительно очень сложную программу», — сказал Альтман. «Скорость, с которой я печатаю новые идеи, — это предел того, что можно воплотить в жизнь».