Генеративный ИИ — ИИ, который может писать эссе, создавать произведения искусства, музыку и многое другое — продолжает привлекать внимание инвесторов. По данным одного из источников, в первом квартале 2023 года стартапы в области генеративного ИИ привлекли 1.7 млрд долларов, а еще 10.68 млрд долларов это сделки, объявленные в этом квартале.
В этой области работает множество конкурентов, в том числе такие гранды, как OpenAI и Anthropic. Но, несмотря на это, венчурные фонды не избегают непроверенных игроков и новичков.
Например, компания Together, разрабатывающая генеративный ИИ с открытым исходным кодом, сегодня объявила о привлечении 20 миллионов долларов в посевном раунде во главе с Lux Capital при участии Factory, SV Angel, First Round Capital, Long Journey Ventures, Robot Ventures, Definition Capital, Susa Ventures, Cadenza Ventures и SCB 10x. В проекте также приняли участие несколько инвесторов-ангелов, включая Скотта Банистера, одного из основателей PayPal, и Джеффа Хаммербахера, сотрудника-основателя Cloudera.
“Together возглавляет «момент Linux» для AI, предоставляя открытую экосистему вычислений и лучшие в своем классе модели», — сообщил Брэндон Ривз из Lux Capital. «Команда Together стремится создать яркую открытую экосистему, в которой смогут участвовать все — от частных лиц до предприятий».
Together, запущенный в июне 2022 года, является детищем Випула Веда Пракаша, Се Чжана, Криса Ре и Перси Ляна. Пракаш ранее основал поисковую платформу для социальных сетей Topsy, которая в 2013 году была приобретена компанией Apple, где он впоследствии стал директором. Чжан — доцент информатики в ETH Zurich, в настоящее время он находится в академическом отпуске и ведет исследования в области «децентрализованного» ИИ. Что касается Ре, то он является соучредителем различных стартапов, включая SambaNova, которая создает аппаратное обеспечение и интегрированные системы для ИИ. А Лян, профессор информатики в Стэнфорде, руководит университетским Центром исследований базовых моделей (CRFM).
Совместно Пракаш, Чжан, Ре и Лян стремятся создать генеративные модели ИИ с открытым исходным кодом и услуги, которые, по их словам, «помогут организациям внедрить ИИ в свои продакшен приложения». С этой целью Together создает облачную платформу для запуска, обучения и тонкой настройки моделей с открытым исходным кодом, которая, по словам соучредителей, будет предлагать масштабируемые вычисления по «значительно более низким» ценам, чем у доминирующих поставщиков (например, Google Cloud, AWS, Azure).
«Мы считаем, что генеративные модели являются значимой технологией для общества, а открытые и децентрализованные альтернативы закрытым системам будут иметь решающее значение для достижения наилучших результатов для ИИ и общества», — сказал Пракаш. «По мере того, как предприятия определяют свои стратегии генеративного ИИ, они стремятся к конфиденциальности, прозрачности, настройке и простоте развертывания. Текущие облачные предложения с закрытыми моделями и данными не отвечают их требованиям».
Он прав — по крайней мере, в той мере, в какой большие компании ощущают давление. Внутренняя служебная записка Google, просочившаяся в начале месяца, подразумевает, что поисковый гигант — и его конкуренты, если на то пошло — не смогут конкурировать с открытыми ИИ инициативами в долгосрочной перспективе. Между тем, OpenAI, как сообщается, готовится к публичному дебюту своей первой модели ИИ с открытым исходным кодом, генерирующей текст, на фоне большого количества альтернатив с открытым исходным кодом.
Один из первых проектов Together, RedPajama, направлен на развитие набора генеративных моделей с открытым исходным кодом, включая модели «чата» по аналогии с ChatGPT от OpenAI. Совместная работа Together и нескольких групп, включая MILA Québec AI Institute, CRFM и ETH’s data science lab, DS3Lab, RedPajama началась с выпуска набора данных, который позволяет организациям предварительно обучать модели, которые могут быть лицензированы.
Другие совместные проекты компании на сегодняшний день включают GPT-JT, форк открытой модели генерации текста GPT-J-6B (выпущенной исследовательской группой EleutherAI), и OpenChatKit, попытка создания аналога ChatGPT.
«Сегодня обучение, тонкая настройка или разработка генеративных моделей с открытым исходным кодом является чрезвычайно сложной задачей», — говорит Пракаш. «Существующие решения требуют наличия значительного опыта в области ИИ и одновременно способности управлять необходимой крупномасштабной инфраструктурой. Платформа Together решает обе проблемы «из коробки», предлагая простое в использовании и доступное решение».
Однако насколько простым будет Together, еще предстоит выяснить — платформа еще не запущена в работу. И, можно сказать, что ее усилия немного дублируются в контексте более широкого ИИ-ландшафта. Количество моделей с открытым исходным кодом, как от сообществ, так и от крупных лабораторий, растет с каждым днем. И хотя не все они лицензированы для коммерческого использования, некоторые, например, Dolly 2.0 от Databricks, лицензированы.
На фронте аппаратной инфраструктуры ИИ, помимо крупных провайдеров публичных облаков, такие стартапы, как CoreWeave, утверждают, что предлагают мощные вычисления по ценам ниже рыночных. Были даже попытки создать бесплатные сервисы для запуска моделей ИИ, генерирующих тексты, на базе сообщества (Together намерена пойти по стопам этих общественных групп, создав платформу под предварительным названием Together Decentralized Cloud, которая будет объединять аппаратные ресурсы, включая GPU, добровольцев со всего интернета).
Что же предлагает Together? Большую прозрачность, контроль и конфиденциальность, утверждает Пракаш. Это предложение не отличается от предложения стартапа Stability AI, который направляет вычислительные ресурсы и капитал на исследования с открытым исходным кодом, одновременно коммерциализируя различные готовые продукты и продавая услуги.
«Регулируемые предприятия станут крупными потребителями открытого кода, поскольку модели с открытым кодом, предварительно обученные на открытых наборах данных, позволяют организациям полностью проверить, понять и настроить модели для своих собственных приложений», — сказал он. «Мы считаем, что проблемы в области ИИ могут быть преодолены только совместными усилиями мирового сообщества. Поэтому мы сделали своей миссией создание и управление самоподдерживающейся открытой экосистемой, которая будет создавать лучшие ИИ-системы для человечества».
Это, безусловно, высокая цель. И это самое начало для Together, у которого пока нет даже клиентов, а тем более доходов. Но компания стремится вперед, планируя увеличить численность своей команды с 24 сотрудников до примерно 40 к концу года и потратить оставшуюся часть начального капитала на исследования, инфраструктуру и разработку продукта.
«Решение Together, основанное на генеративных моделях с открытым исходным кодом, было создано на основе понимания требований крупных организаций и удовлетворения каждой из этих потребностей, чтобы предоставить предприятиям основную платформу для их стратегии генеративного ИИ», — сказал Пракаш. «Together вызывает огромный интерес у предприятий, стремящихся к большей прозрачности, контролю и конфиденциальности».