Если вам когда-либо понадобится доказательство того, что мир технологий ИИ движется со скоростью света, вам достаточно взглянуть на то, что делает Anthropic. Чуть больше месяца назад Anthropic выпустила Opus 4.7 для широкой публики — новая модель показала впечатляющие улучшения по сравнению с предыдущей. Что ж, вот мы снова здесь, чтобы сказать, что Opus 4.7 — это уже устаревшая информация, а 4.8 призвана сделать предыдущую модель прошлым.
Anthropic подробно рассказала о нововведениях в Claude Opus 4.8 в своем блоге. Вы можете увидеть прогресс, достигнутый компанией по сравнению с версией 4.7, на диаграмме выше. Наиболее заметные улучшения касаются агентов разработки (с увеличением возможностей почти на 5 процентных пунктов) и агентов терминальной разработки (с увеличением более чем на 8 процентных пунктов). Напомним, что Claude Opus 4.7 вышел в середине апреля, и Anthropic уже предлагает новую версию со значительными улучшениями.
Однако, помимо статистических улучшений, модель Claude Opus 4.8 обладает приятным дополнительным преимуществом: она больше не будет так часто вас обманывать. В сообщении о запуске Anthropic первые тестировщики отметили, что новая модель «с большей вероятностью выявляет неопределенности в своей работе и с меньшей вероятностью делает необоснованные заявления».
«Одно из наиболее заметных улучшений в Opus 4.8 — это его честность. Мы обучаем все наши модели быть честными — например, избегать утверждений, которые они не могут подтвердить. Но общая проблема с моделями ИИ заключается в том, что они иногда делают поспешные выводы, уверенно заявляя о прогрессе в своей работе, несмотря на слабые доказательства. Первые тестировщики сообщают, что Opus 4.8 чаще указывает на неопределенность в своей работе и реже делает неподтвержденные утверждения».
Вместе с новой моделью Anthropic запустила функцию под названием Dynamic Workflows, которая будет доступна в режиме предварительного просмотра для исследований. Система предназначена для того, чтобы помочь более крупным моделям, таким как Opus, управлять сложными задачами, охватывающими сотни параллельных подсистем.
«Claude Code вместе с Opus 4.8 теперь может осуществлять миграцию кода в масштабах сотен тысяч строк кода от начала и до слияния, используя существующий набор тестов в качестве ограничителя», — поясняется в сообщении.
Вы можете попробовать Claude Opus 4.8 прямо сейчас, так что обязательно протестируйте его и посмотрите, как он улучшит ваш рабочий процесс. И, полагаю, увидимся снова в следующем месяце, когда Anthropic неизбежно выпустит Opus 4.9.

