Microsoft выпустила модель Phi-2, которая «может работать на мобильном устройстве»

AppTractor

3 года назад

Стремительный темп выхода все новых и новых моделей генеративного ИИ не снижается, даже когда мы приближаемся к финалу 2023 года и к традиционному периоду зимнего праздничного затишья.

Microsoft Research сегодня объявило о выпуске Phi-2, малой языковой модели (small language model, SML) для работы с текстом, которая «достаточно мала, чтобы работать на ноутбуке или мобильном устройстве», говорится в сообщении компании.

В то же время Phi-2 с его 2.7 миллиарда параметров (связей между искусственными нейронами) может похвастаться производительностью, сравнимой с другими, гораздо более крупными моделями, включая Llama 2 7B от Meta* с 7 миллиардами параметров и даже Mistral-7B, еще одной моделью с 7 миллиардами параметров.

Исследователи Microsoft также отметили в своем блоге, посвященном выпуску Phi-2, что она превосходит новую модель Gemini Nano от Google несмотря на то, что та имеет на полмиллиарда параметров больше, и обеспечивает меньшую «токсичность» и смещение в ответах, чем Llama 2.

Microsoft также не смогла удержаться от того, чтобы не подколоть Google, который сейчас много критикуют за постановочное демонстрационное видео Gemini, в котором компания показывала, как ее готовящаяся к выпуску самая большая и мощная новая модель ИИ Gemini Ultra способна решать довольно сложные задачи по физике и даже исправлять ошибки студентов в них. Как оказалось, несмотря на то, что по размерам модель Microsoft, скорее всего, в разы меньше Gemini Ultra, Phi-2 также смогла правильно ответить на вопрос и поправить ученика с помощью тех же подсказок.

Однако, несмотря на эти обнадеживающие результаты, у Phi-2 есть серьезное ограничение, по крайней мере, на данный момент — модель лицензирована только для «исследовательских целей», а не для коммерческого использования, согласно специальной лицензии Microsoft Research License, которая также гласит, что Phi-2 может использоваться только для «некоммерческих, не приносящих дохода, исследовательских целей». Таким образом, компаниям, желающим создавать на его основе продукты, пока не повезло.