Разработка
Полное руководство для начинающих по автономным агентам
Итак, давайте начнем с того, что вы уже знаете.
Искусственный интеллект можно использовать для выполнения очень специфических задач, таких как рекомендация контента, написание копий, ответы на вопросы и даже создание фотографий, неотличимых от реальных.
Вы говорите искусственному интеллекту выполнить одну задачу, он ее выполняет. Все просто.
Но что, если вы не хотите придумывать все задачи для ИИ? Что если вы хотите, чтобы он был не просто инструментом, а партнером по команде? Что если вы хотите, чтобы ИИ думал сам за себя?
По-настоящему думал за себя.
Представьте, что вы создали ИИ, которому можно поставить цель, даже такую неопределенную, как «Создать лучшее мороженое в мире», а ИИ составит список дел, выполнит их, добавит новые дела, основываясь на своем прогрессе, а затем продолжит этот процесс, пока цель не будет достигнута.
Именно этим занимаются «автономные агенты», и они являются самым быстрорастущим направлением среди ИИ-разработчиков, однако большинство людей о них не знают.
(На момент написания этой статьи ни одна крупная публикация не писала об автономных агентах, а после публикации лишь несколько изданий рассказали о них, так что если вы читаете эту статью… вы ранняя пташка).
Что такое автономные агенты? Почему они представляют собой такую большую возможность? Как они работают? Как это выглядит в будущем? Как я могу создать или использовать его? Как я могу познакомиться с другими людьми, заинтересованными в автономных агентах?
На эти вопросы я собираюсь ответить для вас прямо сейчас.
Готовы? Давайте сделаем это.
P.S. Я генеральный директор и соучредитель компании Octane AI, где в течение семи лет мы создавали продукты разговорного ИИ, а в последнее время создаем генеративный ИИ и автономные агентские решения для брендов. В 2016 году я предсказал, что примерно сейчас чатботы взлетят и начнут заменять стандартные пользовательские интерфейсы веб-сайтов, и сейчас более 100 миллионов человек пользуются ChatGPT и подобными ему сайтами. Сейчас я точно так же предсказываю, что автономные агенты получат широкое распространение в будущем, но это предсказание не сбудется через семь лет, а произойдет молниеносно.
P.P.S. После написания этой статьи я показал черновик 125 самым умным и интересным людям, которых я знаю, включая Эмада Мостаке (основателя Stability AI), Тони Ху (бывшего исполняющего обязанности главы отдела новых технологий ФБР и основателя Bondoo AI), Троя Картера (бывшего менеджера Леди Гаги), Сахила Лавингиа (основателя Gumroad), Элизабет Йин (соучредитель Hustlefund VC), Хью Хоуи (автор книги «Иллюзия»), Крис Йех (автор книги «Блицскейлинг»), экспертам из NVIDIA, Meta, инвесторам, таким как Райан Гувер (создатель Product Hunt) и Эрика Брешиа (директор Redpoint Ventures, в прошлом COO Github), и многим-многим другие. Их мысли и мнения разбросаны по всему тексту, они дадут вам уникальные знания, впервые представленные миру.
Что такое автономные агенты?
Автономные агенты — это программы на базе ИИ, которые, получив цель, способны создавать для себя задачи, выполнять задачи, создавать новые задачи, изменять приоритеты в списке задач, выполнять новую главную задачу и так до тех пор, пока цель не будет достигнута.
Прочитайте это описание еще раз, потому что, хотя оно простое, оно дикое.
Автономные агенты могут быть разработаны для выполнения любого количества задач, от управления аккаунтом в социальных сетях, инвестирования на рынке до придумывания лучшей детской книги.
«И это, типа, реально? Они существуют прямо сейчас?»
Да, я знаю, что это звучит как научная фантастика, но они функционируют и существуют. Если вы умеете программировать, вы можете сделать такую штуку всего за несколько минут. И это только начало.
Методы программирования и ИИ, необходимые для работы автономных агентов, являются реальными и чрезвычайно новыми. Существует множество проектов с открытым исходным кодом, таких как AutoGPT, BabyAGI и Jarvis от Microsoft, которые являются популярными на Github, в сообществах и отделах ИИ.
За первые две недели создания открытой кодовой базы для создания автономных агентов, почти 100,000 разработчиков создали свои проекты, совершенствуя их и доводят до предела, и это только в первые несколько недель после изобретения этих концепций. Число разработчиков, работающих с этой технологией, растет все быстрее.
Проект стал больше, чем давно существующие и популярные кодовые базы, включая laravel, bitcoin, django и pytorch.
Это не научная фантастика. Многие считают, что эти автономные агенты — начало настоящего общего искусственного интеллекта, обычно называемого AGI (Artificial General Intelligence), что является термином, используемым для описания ИИ, который обрел разум и стал «живым».
Посмотрите на этого автономного агента, который только что был выпущен компанией HyperWrite. Вы видите, как он живет в браузере и помогает вам заказать пиццу.
Вы просто говорите: «Закажите большую простую пиццу из Dominos в One Vanderbilt«, и он просто… делает это.
Или, возможно, еще более впечатляющий эксперимент, проведенный в сотрудничестве между Стэнфордом и Google, в котором они создали виртуальный город из 25 автономных агентов и поручили одному из них спланировать вечеринку в честь Дня святого Валентина.
Симулированные люди занимались своими делами, разговаривали друг с другом, формировали новые воспоминания, и в конце концов большинство из них узнали о вечеринке в честь Дня святого Валентина и явились на нее.
«Окей, эээ, безумие… Значит, автономные агенты существуют… И ты просто говоришь ему, какая у него цель, а потом он сам управляет собой вечно?»
Да.
Вы просто даете ему единственную цель, а автономный агент делает все остальное.
Прямо как хороший сотрудник или товарищ по команде.
Хотя, если вы захотите, вы также можете спроектировать автономного агента так, чтобы в определенные ключевые моменты принятия решений он отчитывался перед вами, и вы могли бы на время сотрудничать с ним.
«Но что могут делать автономные агенты, Мэтт? Например, когда вы говорите, что они выполняют задания, что вы под этим подразумеваете?»
Отличный вопрос!
Помимо анализа цели и постановки задач, автономные агенты могут обладать рядом способностей, которые позволяют им выполнять любые цифровые задачи, которые может выполнить человек, например:
- Доступ к просмотру Интернета и использованию приложений
- Долгосрочная и краткосрочная память
- Управление компьютером
- Доступ к кредитной карте или другой форме оплаты
- Доступ к большим языковым моделям (LLM), таким как GPT, для анализа, обобщения, составления мнений и ответов.
Кроме того, эти автономные агенты будут иметь разные формы и размеры. Некоторые будут работать за кулисами, где пользователь не будет знать, что они делают, а некоторые будут видимыми, как в примере выше, где пользователь может следить за каждой «мыслью» ИИ.
«Мэтт, я читаю то, что вы пишете, мне кажется, я понимаю, о чем вы говорите, но не могли бы вы привести пример на простом языке, чтобы я мог убедиться, что понимаю«.
Да, конечно.
Вот суперпростой пример того, как может работать автономный агент.
Допустим, есть автономный агент, который помогает проводить исследования, и мы хотим получить сводку последних новостей по определенной теме, допустим, «Новости о Twitter».
- Мы говорим агенту: «Твоя задача — узнать последние новости о Twitter, а затем отправить мне сводку».
- Агент смотрит на цель, использует ИИ типа OpenAI GPT-4, который позволяет ему понять, что написано, и придумывает свою первую задачу. «Задача: Найти в Google новости, связанные с Twitter».
- Затем агент ищет в Google новости о Twitter, находит лучшие статьи и возвращается со списком ссылок. Первая задача выполнена.
- Теперь агент оглядывается на свою основную цель (узнать последние новости о Twitter и затем отправить резюме) и на то, что он только что выполнил (получил кучу ссылок на новости о Twitter), и решает, какими должны быть его следующие задачи.
- Он придумывает две новые задачи. 1) Написать резюме новости. 2) Прочитать содержание ссылок на новости, найденных через Google.
- Теперь агент останавливается на секунду, прежде чем продолжить, ему нужно убедиться, что эти задачи расположены в правильном порядке. Действительно ли он должен сначала написать резюме? Нет, он определяет, что главным приоритетом является чтение содержания новостных ссылок, найденных через Google.
- Агент читает содержание статей, а затем снова возвращается к списку дел. Он думает добавить новую задачу по обобщению содержания, но эта задача уже есть в списке дел, поэтому он не добавляет ее.
- Агент проверяет список дел, в нем остается только один пункт — обобщить прочитанный контент, что он и делает. Он отправляет вам резюме, как вы и просили.
Вот схема, показывающая, как это работает.
Очень круто, правда?
Не забывайте, что это только начало новой парадигмы. Она не совершенна, она еще не захватила мир, но концепция пугающе мощная, и с ростом разработок и экспериментов она быстро войдет в нашу повседневную жизнь.
Итак, теперь вы понимаете на высоком уровне, что такое автономный агент, но почему именно они представляют собой такую большую возможность?
Давайте разберемся в этом.
Почему автономные агенты — это такая большая возможность
Совершенно очевидно, что скоро у вас будет не только возможность нанимать людей в качестве сотрудников, но и нанимать искусственный интеллект в виде автономных агентов.
И они не будут (даже близко) такими дорогостоящими, как люди, они не будут спать, не будут увольняться и будут работать чрезвычайно эффективно.
Эти автономные агенты будут существовать в каждой отрасли и для каждой задачи, которую только можно себе представить.
Это лишь несколько примеров. Дайте волю своему воображению.
Список можно продолжать и продолжать. Все, что может сделать человек, автономный агент (со временем, но скоро, а в некоторых случаях уже сейчас) сможет сделать лучше.
Что же делать с этой информацией?
Есть две вполне реальные возможности.
- Вы создаете автономных агентов и предоставляете их другим для найма.
- Вы нанимаете автономных агентов и теперь можете позволить себе быть более продуктивным в личной жизни или в бизнесе.
Представьте себе мир, в котором один человек создает компанию, в команде которой работают только автономные агенты. В течение вашей жизни вы, вероятно, увидите, как команда из одного человека сделает это и достигнет рыночной стоимости более миллиарда долларов, для чего сейчас требуется много людей, работающих вместе.
Сейчас, в самом начале пути, будет период, когда те, кто первыми создадут автономные агенты или будут их использовать, будут иметь огромное преимущество перед конкурентами, которые еще не используют эти системы.
Прочитав эту статью, вы уже опередили 99% всего мира.
Давайте более подробно рассмотрим, как работают эти автономные агенты.
Как работают автономные агенты
Вы уже прочитали о том, как работают автономные агенты, но я подумал, что будет полезно дать вам одну из версий общего фреймворка, а также пошагово разобрать пару примеров автономных агентов.
Сначала приведем обобщенную схему работы автономного агента:
- Инициализация цели: определение цели для ИИ.
- Создание задачи: ИИ проверяет свою память на наличие последних X выполненных задач (если таковые имеются), а затем использует свою цель и контекст недавно выполненных задач для создания списка новых задач.
- Выполнение задач: ИИ выполняет задачи автономно.
- Хранение в памяти: задание и результаты выполнения хранятся в векторной базе данных.
- Сбор отзывов: ИИ собирает отзывы о выполненном задании в виде внешних данных или внутреннего диалога с ИИ. Эта обратная связь будет использована для следующей итерации адаптивного технологического цикла.
- Генерация новых задач: ИИ генерирует новые задачи на основе собранной обратной связи и внутреннего диалога.
- Расстановка приоритетов задач: ИИ изменяет приоритеты в списке задач, анализируя цель и просматривая последнюю выполненную задачу.
- Выбор задачи: ИИ выбирает из списка приоритетных задач самые важные и приступает к их выполнению, как описано в шаге 3.
- Итерация: ИИ повторяет шаги с 4 по 8 в непрерывном цикле, позволяя системе адаптироваться и развиваться на основе новой информации, обратной связи и меняющихся требований.
Довольно невероятно.
Но теперь давайте применим это к нескольким различным случаям использования, которые я решил экстраполировать.
Пример №1: Автономный агент — менеджер социальных сетей
Допустим, вместо того чтобы нанимать менеджера социальных сетей для управления вашими аккаунтами в социальных сетях, вы хотите, чтобы автономный агент делал все за вас за меньшую цену и круглосуточо.
Вот как может выглядеть фреймворк для такого автономного агента.
- Инициализация цели: установка начальных параметров, такие как целевая аудитория, платформы социальных сетей, категории контента и частота публикации.
- Сбор данных: сбор данных о прошлых постах в социальных сетях, взаимодействии пользователей и тенденциях, характерных для конкретной платформы. Это могут быть лайки, шаринг, комментарии и другие показатели вовлеченности.
- Анализ контента: анализ собранных данных для выявления закономерностей, популярных тем, хэштегов и влиятельных лиц, имеющих отношение к вашей целевой аудитории. Этот этап может включать обработку естественного языка и методы машинного обучения для понимания контента и его контекста.
- Создание контента: на основе анализа генерируются идеи контента и создаются посты в социальных сетях с учетом платформы и предпочтений аудитории. Для этого можно использовать сгенерированный ИИ текст, изображения или видео, а также включается пользовательский контент или контент, собранный из других источников.
- Составление расписания: определяется оптимальное время для размещения каждого фрагмента контента на основе тенденций, характерных для конкретной платформы, активности аудитории и желаемой частоты. Составляется соответствующее расписание постов.
- Мониторинг эффективности: отслеживается эффективность каждого поста с точки зрения показателей вовлеченности, таких как лайки, доли, комментарии и количество переходов по ссылкам. По возможности собираются отзывы пользователей для дальнейшего уточнения понимания предпочтений аудитории.
- Итерации и улучшения: анализируются данные о производительности и отзывы пользователей, чтобы определить области для улучшения. Обновляется стратегию контента, процессы создания и планирования, чтобы учесть эти идеи. Проходятся этапы 2-7, чтобы постоянно совершенствовать систему управления социальными сетями и повышать ее эффективность с течением времени.
Включив эту систему циклов в управление социальными сетями, вы сможете создать динамичную и адаптивную стратегию, которая будет развиваться в соответствии с предпочтениями вашей аудитории и постоянно меняющимся ландшафтом социальных сетей. Это поможет увеличить вовлеченность, охват и общую эффективность ваших усилий в социальных сетях.
Пример №2: Автономный агент — менеджер политической кампании
Что если вы баллотируетесь на политическую должность и хотите использовать умного и никогда не спящего помощника, чтобы помочь вам победить?
Вот как может выглядеть автономный агент, который помогает вам выиграть выборы.
- Инициализация цели: победить на выборах, набрав большинство голосов.
- Сбор данных: сбор данные об избирателях, демографических показателях, ключевых вопросах, сообщениях кампании и другой необходимой информацию.
- Анализ контекста: анализ собранных данных, чтобы выявить тенденции, возможности и проблемы. На основе этого анализа уточняется первоначальная цель, разбивая ее на конкретные подцели, такие как привлечение неопределившихся избирателей, повышение явки избирателей в ключевых районах или улучшение сообщений кампании по конкретным вопросам.
- Формирование задач: составление задач, связанных с уточненными подцелями, например, планирование мероприятий по работе с избирателями, создание целевой рекламы или разработка политических предложений.
- Расстановка приоритетов задач: ранжирование задач на основе их потенциального влияния на достижение подцелей и общей цели — победы на выборах.
- Выполнение задач: решение задач с наивысшим приоритетом, распределение ресурсов и назначение членов команды по мере необходимости.
- Мониторинг эффективности: оценка эффективности выполненных задач, отслеживание ключевых показателей эффективности, таких как вовлеченность избирателей, общественное мнение и показатели сбора средств. Оценка успеха отдельных задач и общего прогресса кампании в достижении подцелей и первоначальной цели.
- Итерации и улучшения: анализ данных о результатах работы, чтобы определить области для улучшения. Обновление стратегии кампании, чтобы учесть эти идеи. Повторение этапов 2-8, чтобы постоянно совершенствовать систему управления политической кампанией и повышать ее эффективность с течением времени.
Сначала один кандидат может использовать автономного агента и иметь огромное преимущество над всеми, но представьте, как это будет выглядеть, когда у каждого кандидата будет один… или много агентов.
Пример №3: Автономный агент — репетитор по математике
Здесь опишем автономного агента, предназначенного для обучения ребенка математике.
- Инициализация цели: определить текущий уровень математических навыков ребенка и установить индивидуальный путь обучения, чтобы помочь ему улучшиться.
- Сбор данных: сбор информации о стиле обучения ребенка, его прогрессе и успеваемости с помощью оценок, взаимодействия и обратной связи.
- Анализ контекста: анализ собранных данных для выявления сильных и слабых сторон, предпочтений в обучении, а также любых внешних факторов, влияющих на прогресс ребенка.
- Генерация заданий: генерирование заданий на основе потребностей и пути обучения ребенка, например, выбор подходящих упражнений, предоставление объяснений или примеров из реальной жизни.
- Определение приоритетов заданий: ранжирование заданий на основе их потенциального влияния на обучение и развитие навыков ребенка, обеспечивая баланс между сложностью и увлекательностью.
- Выполнение заданий: выполнение наиболее приоритетные задачи, адаптируя подход к обучению и подачу материала по мере необходимости, чтобы максимально повысить эффективность обучения и вовлеченность ребенка.
- Мониторинг эффективности: оценка эффективности репетиторства путем отслеживания ключевых показателей эффективности, таких как прогресс в достижении целей обучения, улучшение математических навыков, вовлеченность и удовлетворенность ребенка.
- Петля обратной связи: постоянно отслеживать успеваемость ребенка и обновлять шаги по анализу контекста, формированию задач и определению их приоритетности на основе новых данных и представлений. При необходимости корректировать первоначальную цель и траекторию обучения, чтобы лучше поддерживать развитие математических навыков ребенка.
- Итерация и совершенствование: анализ результатов работы ребенка и обновление этапов контекстного анализа, создания заданий и определения приоритетов заданий на основе новых данных и представлений. При необходимости корректировка первоначальной цели и траектории обучения, чтобы лучше поддерживать развитие математических навыков ребенка. Повторить этапы 2-9, чтобы постоянно совершенствовать систему управления обучением и повышать его эффективность с течением времени.
Эта система типа автономного агентного цикла описывает процесс для образовательного репетитора по математике, который адаптивно поддерживает и направляет процесс обучения ребенка, фокусируясь на постоянном совершенствовании и персонализации на основе потребностей и прогресса ребенка.
Будущее автономных агентов
Сейчас человечество находится в самом начале разработки автономных агентов. Мы копаемся в них, ломаем, экспериментируем, делаем плохие и хорошие вещи.
Почти ни один коммерческий продукт еще даже не выпущен, все по-прежнему находятся в режиме разработки.
Но скоро все изменится. Автономные агенты начнут появляться повсюду, и в один прекрасный день будет невероятно странно, если кто-то не будет иметь одного или нескольких автономных агентов, помогающих ему в любой момент времени.
Люди будут двигаться по жизни с помощью всевозможных автономных агентов, дополняющих их движения, решения и действия. Если в какой-то момент у нас появятся нейронные имплантаты, то все это будет происходить беспрепятственно, так же как сегодня работает мышление в собственной голове.
Вот мои прогнозы относительно будущего автономных агентов:
- 2023 год — множество коммерциализированных автономных агентов для игр, личного пользования, маркетинга и продаж.
- 2024 — коммерциализация автономных агентов для каждой категории, но не массовое внедрение.
- 2025 — массовое внедрение автономных агентов во всех категориях для всего, что только можно себе представить.
- 2026 — большинство людей в странах первого мира живут повседневной жизнью при поддержке армии автономных агентов.
В ближайшие 2-5 лет большинство людей будут работать не на человека, а на автономного агента.
«Мэтт, это уже очень много, будущее будет интересным. Но с чего я могу начать работу с автономными агентами уже сегодня?»
Это лучший вопрос, который можно задать. У меня есть все необходимые вам ресурсы.
Позвольте мне показать вам.
Как создавать и использовать автономные агенты
Теперь вы готовы с головой окунуться в мир автономных агентов. Я собираюсь предоставить вам ресурсы, необходимые для того, чтобы начать создавать или использовать автономные агенты самостоятельно.
Мне не терпится увидеть, что вы сможете с этим сделать, и если вы создадите что-то крутое, я с удовольствием на это посмотрю.
Создание автономных агентов
Здесь у вас есть несколько вариантов.
- Создать самому: посмотрите на схему, которую я предоставил ранее, и отправляйтесь в путешествие, чтобы построить все с нуля! Вы определенно сможете это сделать, это не так страшно, как может показаться. Некоторые рекомендуемые программные решения — это GPT-4 от OpenAI, векторная база данных Pinecone и фреймворк LangChain.
- Auto-GPT: это популярный вариант с открытым исходным кодом, созданный Тораном Ричардсом. Он включает в себя опции для подключения к интернету, использования приложений, долгосрочной и краткосрочной памяти и многое другое.
- BabyAGI: еще один популярный вариант с открытым исходным кодом, созданный Йохеем Накаджимой. Хотя этот вариант пока не подключается к Интернету, он очень элегантен и содержит менее 200 строк кода.
- Jarvis от Microsoft: очень похож на Auto-GPT и BabyAGI, но гораздо более надежен и разработан Microsoft и HuggingFace.
Использование автономных агентов
Готовы завести собственного агента? Вот несколько вариантов.
- Используйте любой из вариантов в разделе «Создай свой собственный» выше!
- AgentGPT: создайте и запустите автономный агент (AutoGPT) на сайте, логин не требуется.
- HyperWrite Assistant: расширение для хрома, позволяющее отдавать браузеру команды, а браузер их выполняет.
Неважно, умеете ли вы кодить или еще не умеете, я призываю вас потратить несколько часов на эксперименты. Это не так сложно или трудно, как может показаться, и чем быстрее вы испачкаете руки, тем быстрее вы узнаете об автономных агентах.
Ландшафт автономных агентов широко открыт для интерпретаций и инноваций. 99% сценариев использования еще не созданы или не опробованы, возможности безграничны, и вы можете воспользоваться ими.
Это пространство развивается невероятно быстро, быстрее, чем все, что я когда-либо видел раньше. Кажется, что каждый час появляется новая информация, новые эксперименты и новые релизы.
Как же за всем этим угнаться?
Я позабочусь об этом. Пойдемте со мной.
Как познакомиться с людьми, заинтересованными в автономных агентах
Вы находитесь только в начале пути автономных агентов, и я знаю, что вы все еще горите вопросами и идеями, которыми хотите поделиться.
Если вы сидите и думаете о чем-нибудь из перечисленного ниже, то у меня есть для вас идеальное решение:
«Я хотел бы быть в курсе новых разработок в области автономных агентов».
«У меня есть идея для автономного агента, я хочу поделиться ею с кем-нибудь и посмотреть, что они думают!»
«Я создал автономного агента, я бы хотел поделиться им с людьми!»
«Я хочу инвестировать в людей, создающих автономных агентов».
Если это похоже на вас, и ваше любопытство к автономным агентам разгорелось, вот что вам следует делать дальше.
- Подпишитесь на мою рассылку и подпишитесь на мой новый канал на YouTube, чтобы продолжать получать больше информации, новостей и мыслей о продуктах, связанных с ИИ и автономными агентами. Я создаю продукты (используемые тысячами компаний) в этой области с 2016 года и стараюсь всегда быть на переднем крае происходящего.
- Присоединяйтесь к группе «Автономные агенты» на Facebook*. Здесь вы можете делиться контентом, проектами и мнениями об автономных агентах.
Например, когда я говорил об автономных агентах с Эмадом Мостаке, основателем и генеральным директором Stability AI, его ответ был таким: «Роевой интеллект победит AGI». Что он имел в виду? Подпишитесь на мою рассылку, и мы изучим этот вопрос глубже.
Мир быстро меняется, и я очень хочу вместе с вами окунуться с головой в слияние человечества и искусственного интеллекта.
Создавайте то, что нужно людям. Постарайтесь не разрушить мир случайно. Скоро еще поговорим.
-
Интегрированные среды разработки2 недели назад
Лучшая работа с Android Studio: 5 советов
-
Новости4 недели назад
Видео и подкасты о мобильной разработке 2024.43
-
Новости3 недели назад
Видео и подкасты о мобильной разработке 2024.44
-
Исследования2 недели назад
Поможет ли новая архитектура React Native отобрать лидерство у Flutter в кроссплатформенной разработке?