Twin Labs — парижский стартап, который хочет создать продукт для автоматизации повторяющихся задач, таких как подключение новых сотрудников ко всем внутренним сервисам, повторный заказ товаров, когда их не хватает на складе, загрузка финансовых отчетов по нескольким SaaS-продуктам, обращение к потенциальным клиентам и многое другое.
«Отправной точкой Twin стала научно-фантастическая идея. Мы наблюдали за развитием технических возможностей LLM — Foundation моделей. И мы задали себе вопрос: сможем ли мы повторить себя, обучив агента искусственного интеллекта тому, как мы выполняем свои задачи?» — рассказал TechCrunch соучредитель и генеральный директор Twin Labs Хьюго Мерсье.
В случае с Twin Labs самое интересное не то, что они делают — улучшают внутренние процессы, — а то, как они это делают. Компания использует мультимодальные модели с возможностями зрения, такие как GPT-4 with Vision (GPT-4V), чтобы повторить то, что обычно делает человек.
Прежде чем остановиться на мультимодальных моделях, в Twin Labs сначала попытались разработать автономных агентов с помощью традиционных LLM. «Мы протестировали множество вещей, реализовали исследовательские работы, протестировали репозитории GitHub с открытым исходным кодом. В целом, вывод таков: LLM совершенно ненадежны. Это означает, что LLM принимают неправильные решения», — говорит Мерсье. «В итоге задача не решается».
По его словам, GPT-4V был обучен работе с множеством различных программных интерфейсов и базовых кодовых баз, что открыло новые возможности. «Когда вы показываете интерфейс, он понимает, какая функция скрывается за кнопкой», — говорит Мерсье.
В отличие от Zapier и других продуктов для автоматизации, Twin Labs не полагается на API и разработку сложных многоэтапных процессов. Вместо этого Twin Labs больше похож на веб-браузер. Инструмент может автоматически загружать веб-страницы, нажимать на кнопки и вводить текст.
Например, если вы принимаете человека на работу, вам может понадобиться добавить его данные в систему расчета заработной платы, отправить приглашение в Slack, создать учетную запись Google Workspace и предложить новому сотруднику создать учетную запись в медицинском страховом агентстве.
Обычно компании хранят длинный список задач и просто выполняют его каждый раз, когда в команде появляется новый сотрудник. Эти задачи несложные, но очень важно выполнить их правильно, в нужном порядке. Вот почему так важно иметь возможность обучать ИИ-помощника Twin Labs с помощью записи экрана и описаний на естественном языке.
Но стартап еще не достиг этой цели — он работает в этом направлении. Хьюго Мерсье и Жоао Жусти, два сооснователя, потратили последние шесть месяцев на создание прототипа этого продукта. Они также привлекли 3 миллиона долларов в качестве предварительного финансирования от Betaworks, Motier Ventures и многих инвесторов-ангелов.
Перед системой автономных агентов Twin Labs стоит еще много задач. Например, выполнение заданий стоит немалых денег, но стоимость API и инфраструктуры в сфере ИИ стремительно снижается. Сначала Twin Labs выпустит продукт с библиотекой предварительно обученных задач, чтобы убедиться, что они хорошо работают. После этого стартап рассчитывает открыть свою платформу, чтобы клиенты могли создавать собственные задачи.
Хотя у многих людей продукты ИИ ассоциируются с интерфейсом чатбота, подход Twin Labs интересен тем, что это инновационный способ взаимодействия с моделями ИИ. «Мы действительно хотели разобраться с тем, что люди делают каждый день, и как мы можем взять на себя некоторые вещи, которые на самом деле доставляют им много хлопот», — говорит Мерсье.