Новости

Anthropic выпустил Claude Opus 4.7

Опубликовано

4 месяца назад

17.04.2026

Автор:

Компания Anthropic выпустила Claude Opus 4.7, свою самую мощную общедоступную модель на сегодняшний день, демонстрирующую лидирующие в бенчмарках показатели в разработке программного обеспечения и агентном рассуждении, что увеличивает разрыв между Claude и OpenAI GPT-5.4, а также Google Gemini 3.1 Pro в задачах, наиболее важных для разработчиков и корпоративных пользователей.

Выпуск происходит в момент, когда коммерческий успех Anthropic трудно переоценить. Компания достигла годового дохода в 30 миллиардов долларов, привлекла предложения инвесторов на сумму около 800 миллиардов долларов и находится на ранней стадии переговоров о IPO. Opus 4.7 — это модель, которая должна оправдать эти показатели не победами во всех бенчмарках, а тем, что именно на этой модели будут основывать свои проекты предприятия и разработчики.

Тесты

Главные показатели — в разработке программного обеспечения. В SWE-bench Pro, бенчмарке, тестирующем способность модели решать реальные проблемы программного обеспечения из репозиториев с открытым исходным кодом, Opus 4.7 показывает результат 64,3%, что выше показателя Opus 4.6 (53,4%) и значительно опережает GPT-5.4 (57,7%) и Gemini 3.1 Pro (54,2%). В SWE-bench Verified, тщательно отобранном подмножестве результатов, показатель составляет 87,6%, по сравнению с 80,8% у предшественника и 80,6% у Gemini 3.1 Pro.

CursorBench, измеряющий производительность автономного кодирования в популярном редакторе кода с искусственным интеллектом, показывает аналогичный скачок: 70%, по сравнению с 58% в Opus 4.6. Для модели, которая уже является выбором по умолчанию в Cursor и Claude Code, улучшение показателей, наиболее связанных с тем, как разработчики её фактически используют, является значительным.

В отношении логического мышления, измеряемого GPQA Diamond, наблюдаются меньшие результаты. Opus 4.7 набирает 94,2%, GPT-5.4 Pro — 94,4%, а Gemini 3.1 Pro — 94,3%. Различия находятся в пределах шума. Передовые модели фактически насытили этот бенчмарк, что означает, что конкурентное преимущество смещается от показателей логического мышления к прикладной производительности при решении сложных многоэтапных задач.

Агенты

Наиболее значимые улучшения Opus 4.7 могут быть не отражены ни одним отдельным бенчмарком. Компания Anthropic утверждает, что модель обеспечивает 14% улучшение по сравнению с Opus 4.6 на сложных многоэтапных рабочих процессах, используя при этом меньше токенов и производя в три раза меньше инструментальных ошибок. Это первая модель Claude, прошедшая так называемые «тесты на неявные потребности» (implicit-need tests) от Anthropic — задачи, в которых модель должна сама определить, какие инструменты или действия необходимы, а не получать явные указания.

Модель также внедряет координацию нескольких агентов — возможность управлять параллельными потоками ИИ, а не обрабатывать задачи последовательно. Для корпоративных пользователей, одновременно использующих Claude для проверки кода, анализа документов и обработки данных, это возможность, которая напрямую влияет на производительность. Anthropic утверждает, что Opus 4.7 разработан для поддержания концентрации внимания на протяжении многочасовых рабочих процессов — утверждение, которое, если оно подтвердится, решает одну из самых распространенных проблем передовых моделей: они теряют согласованность и точность при выполнении длительных агентных задач.

Еще один важный аспект — отказоустойчивость. Модель разработана таким образом, чтобы продолжать выполнение при сбоях инструментов, которые остановили бы Opus 4.6, восстанавливаясь и адаптируясь, а не останавливаясь. Для автоматизированных конвейеров, где один сбой может вызвать цепную реакцию, такая устойчивость важнее, чем незначительное улучшение результатов в бенчмарках.

Обработка изображений и контекста

Opus 4.7 обрабатывает изображения с разрешением до 2576 пикселей по длинной стороне, что более чем в три раза превышает возможности предыдущих моделей Claude. Улучшение направлено на анализ корпоративных документов, где отсканированные контракты, технические чертежи и финансовые отчеты часто содержат мелкий шрифт и детали, которые модели обработки изображений с более низким разрешением пропускают или искажают.

Окно контекста остается на уровне одного миллиона токенов, что вдвое меньше, чем два миллиона в Gemini 3.1 Pro, но достаточно для большинства корпоративных сценариев использования. В бенчмарках для исследований с длинным контекстом Opus 4.7 разделил первое место по общему баллу 0,715 по шести модулям исследований и продемонстрировал, по словам экспертов, наиболее стабильную производительность в длинном контексте среди всех протестированных моделей.

Компания Anthropic отмечает, что модель следует инструкциям более буквально, чем её предшественницы, что может потребовать от пользователей корректировки существующих промптов. Это компромисс: более точное следование инструкциям уменьшает двусмысленность, которая иногда приводит к креативным или неожиданным результатам, но также уменьшает галлюцинации и отвлечение от задачи, которые мешают корпоративному развертыванию.

Цены и доступность

Opus 4.7 доступен сразу же в тарифных планах Claude Pro, Max, Team и Enterprise, а также через API по цене 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов. Кэширование с мгновенным откликом обеспечивает экономию затрат до 90%, а API пакетной обработки предоставляет скидку 50% как на входные, так и на выходные данные. Эта модель также доступна через Amazon Bedrock, Vertex AI от Google Cloud и Microsoft Foundry.

Цены остались неизменными по сравнению с Opus 4.6, что означает, что Anthropic обеспечивает существенно лучшую производительность при той же стоимости. Gemini 3.1 Pro стоит дешевле — 2 и 12 долларов за миллион токенов для входных и выходных данных соответственно, но лидерство Opus 4.7 в тестах, важных для корпоративных покупателей, особенно в SWE-bench и агентном рассуждении, может оправдать более высокую цену для клиентов, чьи рабочие нагрузки требуют максимальной производительности.

Компания Anthropic также добавила средства киберзащиты, которые автоматически обнаруживают и блокируют запросы, указывающие на запрещенное или высокорискованное использование в сфере кибербезопасности. Это решение связано с опасениями по поводу двойного назначения, которые побудили компанию ограничить использование своей более мощной модели Mythos всего 11 организациями в рамках проекта Glasswing.

Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.