Site icon AppTractor

Codestral — первая генеративная модель Mistral для кода

Mistral, французский ИИ-стартап, поддерживаемый Microsoft и оцениваемый в 6 миллиардов долларов, выпустил свою первую генеративную ИИ-модель для программирования, получившую название Codestral.

Как и другие модели, генерирующие код, Codestral призвана помочь разработчикам в написании кода и взаимодействии с ним. Она была обучена на более чем 80 языках программирования, включая Python, Java, C++ и JavaScript, объясняет Mistral в своем блоге. Codestral может выполнять функции кодирования, писать тесты и «заполнять» неполный код, а также отвечать на вопросы о кодовой базе на английском языке.

Mistral описывает модель как «открытую», но это спорно. Лицензия стартапа запрещает использовать Codestral и его результаты для любой коммерческой деятельности. Есть исключение для «разработки», но даже оно имеет оговорки. В лицензии содержится прямой запрет на «любое внутреннее использование сотрудниками в контексте деловой активности компании».

Причина может заключаться в том, что Codestral частично обучался на материалах, защищенных авторским правом. Mistral не подтвердила и не опровергла эту информацию в блоге, но это было бы неудивительно: есть свидетельства того, что предыдущие наборы данных для обучения стартапа содержали данные, защищенные авторским правом.

В любом случае, для работы Codestral, модели с 22 миллиардами параметров, требуется мощный ПК (параметры, по сути, определяют качество ИИ-модели в решении той или иной задачи). И хотя она выигрывает у конкурентов по некоторым показателям, это вряд ли можно назвать победой.

Несмотря на непрактичность для большинства разработчиков и незначительное повышение производительности, Codestral наверняка подогреет споры о целесообразности использования моделей, генерирующих код, в качестве помощников программиста.

Разработчики, безусловно, используют инструменты генеративного ИИ, по крайней мере, для решения некоторых задач по кодированию. В опросе Stack Overflow, проведенном в июне 2023 года, 44% разработчиков заявили, что используют ИИ-инструменты в процессе разработки уже сейчас, а 26% планируют это сделать в ближайшее время. Однако у этих инструментов есть очевидные недостатки.

Анализ более 150 миллионов строк кода, внесенных в репозитории проектов за последние несколько лет, проведенный компанией GitClear, показал, что генеративные инструменты разработки приводят к появлению в кодовых базах все большего количества ошибочного кода. Кроме того, исследователи безопасности предупреждают, что такие инструменты могут усилить существующие ошибки и проблемы безопасности в программных проектах. Согласно исследованию, более половины ответов, которые дает ChatGPT от OpenAI на вопросы по программированию, являются неверными.

Это не останавливает такие компании, как Mistral и другие, от попыток монетизировать свои модели (и завоевать умы). Сегодня утром компания Mistral запустила hosted версию Codestral на своей платформе разговорного ИИ Le Chat, а также платный API. Mistral говорит, что она также работает над внедрением Codestral в такие фреймворки и среды разработки приложений, как LlamaIndex, LangChain, Continue.dev и Tabnine.

Exit mobile version