Новая модель искусственного интеллекта от Anthropic теперь может управлять компьютером

AppTractor

2 года назад

Весной прошлого года, в питче для инвесторов, Anthropic заявила, что намерена создать ИИ для виртуальных помощников, которые смогут самостоятельно проводить исследования, отвечать на электронные письма и выполнять другую работу в офисе. Компания называла это «алгоритмом нового поколения для самообучения ИИ» — по ее мнению, если все пойдет по плану, то когда-нибудь можно будет автоматизировать большую часть работы.

Потребовалось некоторое время, но этот ИИ уже начинает проявляться.

Вчера Anthropic выпустила обновленную версию своей модели Claude 3.5 Sonnet, которая может понимать и взаимодействовать с любым десктопными приложением. С помощью нового Computer Use API, который сейчас находится в открытой бета-версии, модель может имитировать нажатие клавиш, кнопок и жестов, по сути, имитируя человека, сидящего за компьютером.

«Мы научили Claude видеть, что происходит на экране, а затем использовать доступные программные инструменты для выполнения задач», — пишет Anthropic в блоге. «Когда разработчик поручает Claude использовать компьютерную программу и предоставляет ему необходимый доступ, Claude смотрит на скриншоты того, что видно пользователю, а затем подсчитывает, на сколько пикселей по вертикали или горизонтали нужно переместить курсор, чтобы нажать в нужном месте».

Разработчики могут опробовать Computer Use через API Anthropic, Amazon Bedrock и Google Cloud Vertex AI platform. Новая версия 3.5 Sonnet без Computer Use раскатывается в приложении Claude и обеспечивает различные улучшения производительности по сравнению с предыдущей версией.

Автоматизация приложений

Инструмент, позволяющий автоматизировать задачи на ПК, — идея не новая. Бесчисленное множество компаний предлагают такие инструменты, начиная от производителей роботизированных платформ (Robotic process automation), которые существуют уже несколько десятилетий, и заканчивая новыми новичками, такими как Relay, Induced AI и Automat.

Некоторые аналитики считают, что ИИ-агенты могут обеспечить компаниям более легкий путь к получению выгоды от усилий, которые они вкладывают в ИИ. Компании, похоже, согласны с этим. Согласно недавнему исследованию Capgemini, 10% организаций уже используют ИИ-агентов, а 82% будут внедрять их в течение следующих трех лет.

Этим летом Salesforce сделала громкие заявления о своих технологиях ИИ-агентов, а Microsoft вчера рассказала о новых инструментах для создания ИИ-агентов. Компания OpenAI, которая разрабатывает свой собственный бренд ИИ-агентов, рассматривает эту технологию как шаг к сверхразумному ИИ.

Anthropic называет свой вариант концепции ИИ-агента «слоем выполнения действий», который позволяет новому 3.5 Sonnet выполнять команды на уровне десктопа. Благодаря своей способности просматривать веб-страницы (не первый случай для моделей ИИ, но первый для Anthropic), 3.5 Sonnet может использовать любой веб-сайт и любое приложение.

«Человек сохраняет контроль, предоставляя определенные подсказки, которые направляют действия Claude, например, «используй данные с моего компьютера и из сети, чтобы заполнить эту форму»», — сообщил представитель Anthropic изданию TechCrunch. «Люди разрешают доступ и ограничивают его по мере необходимости. Claude разделяет подсказки пользователя на компьютерные команды (например, перемещение курсора, нажатие кнопки мыши, ввод текста) для выполнения конкретной задачи».

Платформа для разработки программного обеспечения Replit использовала раннюю версию новой модели 3.5 Sonnet для создания «автономного верификатора», который может оценивать приложения в процессе их создания. Canva, тем временем, заявляет, что изучает возможности использования новой модели для поддержки процесса проектирования и редактирования.

Но чем это отличается от других ИИ-агентов? Это вполне резонный вопрос. Стартап Rabbit, специализирующийся на потребительских гаджетах, создает веб-агента, который может делать такие вещи, как покупка билетов в кино онлайн; компания Adept, которую недавно приобрела Amazon, обучает модели просмотру веб-сайтов и навигации по программному обеспечению; а Twin Labs использует готовые модели, включая GPT-4o от OpenAI, для автоматизации процессов на рабочем столе.

Anthropic утверждает, что новый Sonnet 3.5 — это просто более сильная и надежная модель, которая может справиться с задачами кодирования лучше, чем даже флагманский o1 от OpenAI, согласно бенчмарку SWE-bench Verified. Несмотря на отсутствие специального обучения, обновленный 3.5 Sonnet самостоятельно корректирует и повторяет выполнять задания, когда сталкивается с препятствиями, и может работать над задачами, требующими десятков или сотен шагов.

Но в тесте, призванном проверить способность ИИ-агента помогать в решении задач по бронированию авиабилетов, например, изменению брони на рейс, новая модель 3.5 Sonnet успешно справилась менее чем с половиной задач. В отдельном тесте, включающем такие задачи, как инициирование возврата, 3.5 Sonnet не справился примерно в трети случаев.

Anthropic признает, что обновленный 3.5 Sonnet не справляется с основными действиями, такими как прокрутка и масштабирование, и что он может пропустить «short-lived» действия и уведомления из-за того, как он делает скриншоты и собирает их вместе.

«Computer Use в Claude остается медленным и часто подвержено ошибкам», — пишет Anthropic. «Мы советуем разработчикам начать исследование с задач с низким уровнем риска».

Рискованный бизнес

Но является ли новый 3,5 Sonnet достаточно мощным, чтобы быть опасным? Возможно.

Недавнее исследование показало, что модели без возможности использовать десктопные приложения, такие как GPT-4o от OpenAI, были готовы реализовать небезопасное «многошаговое агентское поведении», например, заказать поддельный паспорт у кого-то в дарк вебе. По словам исследователей, джейлбрейк приводил к высоким показателям успешного выполнения вредоносных задач даже для моделей, защищенных фильтрами и средствами защиты.

Можно представить, как модель с доступом к настольному компьютеру могла бы посеять еще больший хаос — например, используя уязвимости приложений для компрометации личной информации (или сохраняя чаты в открытом виде). Помимо программных рычагов, имеющихся в распоряжении модели, ее связи с интернетом и приложениями могут открыть путь для злонамеренных действий.

Anthropic не отрицает, что выпуск нового Sonnet 3.5 сопряжен с риском. Но компания утверждает, что польза от наблюдения за тем, как модель используется в “дикой природе”, в конечном итоге перевешивает этот риск.

«Мы считаем, что гораздо лучше предоставить доступ к компьютерам сегодняшним, более ограниченным и относительно безопасным моделям», — пишет компания. «Это означает, что мы можем начать наблюдать и учиться на любых потенциальных проблемах, возникающих на этом более низком уровне, постепенно и одновременно наращивая использование компьютеров и меры по снижению безопасности».

Anthropic также утверждает, что предприняла меры по предотвращению злоупотреблений, например, не обучает новый 3.5 Sonnet по скриншотам и подсказкам пользователей, а также не позволяет модели выходить в Интернет во время обучения. Компания утверждает, что разработала классификаторы, чтобы «подтолкнуть» 3.5 Sonnet к действиям, которые считаются рискованными, таким как публикация в социальных сетях, создание учетных записей и взаимодействие с правительственными сайтами.

Anthropic сообщил TechCrunch, что у него есть возможность ограничить доступ к разным веб-сайтам и функциям «в случае необходимости», например, для защиты от спама, мошенничества и дезинформации. В качестве меры предосторожности компания сохраняет все скриншоты, сделанные с помощью Computer Use, не менее 30 дней — срок хранения, который может насторожить некоторых разработчиков.

«Не существует надежных методов, и мы будем постоянно оценивать и совершенствовать наши меры безопасности, чтобы сбалансировать возможности Claude и ответственное использование», — заявили в Anthropic. «Тем, кто использует компьютерную версию Claude, следует принять соответствующие меры предосторожности, чтобы минимизировать подобные риски, в том числе изолировать Claude от особо важных данных на своем компьютере».

Надеемся, этого будет достаточно, чтобы предотвратить худшее.

Более дешевая модель

Главным событием сегодняшнего дня стала обновленная модель 3.5 Sonnet, но Anthropic также сообщила о выходе обновленной версии Haiku, самой дешевой и эффективной модели в серии Claude.

Claude 3.5 Haiku, которая должна появиться в ближайшие недели, будет соответствовать производительности Claude 3 Opus, некогда самой современной модели Anthropic, в определенных бенчмарках при той же стоимости и «приблизительной скорости» Claude 3 Haiku.

«Благодаря низкой задержке, улучшенному выполнению инструкций и более точному использованию инструментов, Claude 3.5 Haiku хорошо подходит для работы с продуктами, ориентированными на пользователя, специализированными субагентскими задачами и созданием персонализированного опыта на основе огромных объемов данных, таких как история покупок, цены или данные о запасах», — пишет Anthropic в своем блоге.

Первоначально 3.5 Haiku будет доступен только в виде текстовой модели, а затем станет частью мультимодального пакета, который сможет анализировать как текст, так и изображения.