Новости
Mistral выпускает Large 2 как ответ ChatGPT и Llama
Оказалось, что Large 2 превосходит Llama 3.1 405B по генерации кода и математической производительности, причем для этого требуется меньше трети параметров.
Вчера компания Mistral выпустила новую флагманскую модель Large 2, которая, как она утверждает, не уступает последним передовым моделям OpenAI и Meta* в плане генерации кода, математики и рассуждений.
Выпуск Mistral Large 2 состоялся всего через день после того, как Meta выпустила свою последнюю и самую лучшую модель с открытым исходным кодом, Llama 3.1 405b. Mistral утверждает, что Large 2 поднимает планку производительности и стоимости для открытых моделей, подкрепляя это несколькими бенчмарками.
Оказалось, что Large 2 превосходит Llama 3.1 405B по генерации кода и математической производительности, причем для этого требуется меньше трети параметров: 123 миллиарда, если быть точным.
В пресс-релизе Mistral сообщает, что одним из ключевых направлений обучения было сведение к минимуму проблем с галлюцинациями в модели. Компания утверждает, что Large 2 была обучена быть более разборчивой в своих ответах, признавая, когда она чего-то не знает, вместо того чтобы придумывать что-то, что кажется правдоподобным.
ИИ-стартап из Парижа недавно привлек 640 миллионов долларов в раунде финансирования серии B, возглавляемом General Catalyst, при оценке в 6 миллиардов долларов. Хотя Mistral — один из самых новых участников рынка искусственного интеллекта, он быстро создает лучшие модели ИИ, или близкие к ним.
Однако важно отметить, что модели Mistral, как и большинство других, не поставляются с открытым исходным кодом в традиционном смысле — для любого коммерческого применения модели требуется платная лицензия. И хотя она более открыта, чем, скажем, GPT-4o, мало у кого в мире есть опыт и инфраструктура для реализации такой большой модели (это относится и к 405 миллиардам параметров Llama, конечно).
В Mistral Large 2 не хватает чего-то, что также отсутствовало во вчерашнем релизе Meta Llama 3.1 — мультимодальных возможностей. OpenAI значительно опережает конкурентов в области мультимодальных ИИ-систем, способных обрабатывать изображения и текст одновременно, что все чаще предлагают некоторые стартапы.
Модель имеет окно на 128,000 лексем, что означает, что Large 2 может принять большое количество данных за один запрос (128,000 лексем равны примерно 300-страничной книге). В новой модели Mistral также улучшена многоязыковая поддержка. Large 2 понимает английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский языки, а также 80 языков программирования. Mistral утверждает, что Large 2 также выдает более лаконичные ответы, чем ведущие модели ИИ, которые имеют тенденцию к болтовне.
Mistral Large 2 доступна для использования в Google Vertex AI, Amazon Bedrock, Azure AI Studio и IBM watsonx.ai. Вы также можете использовать новую модель на сайте Mistral le Plateforme под именем «mistral-large-2407» и бесплатно протестировать ее в конкуренте ChatGPT — le Chat.