Новости

Google собирается раскрыть возможности Gemini Nano для сторонних приложений в Android

Эти новые API позволяют легко реализовать сценарии использования для обобщения, вычитки и переписывания текста, а также для создания описаний изображений.

Опубликовано

1 год назад

19.05.2025

Автор:

AppTractor

Технология генеративного ИИ меняет способы общения и создания контента в Интернете. Многие люди просят чат-ботов с искусственным интеллектом, таких как Google Gemini, выполнить такие задачи, как резюмирование статьи, корректура электронного письма или переписывание сообщения. Однако некоторые люди с опаской относятся к использованию этих чат-ботов с искусственным интеллектом, особенно когда эти задачи связаны с очень личной или конфиденциальной информацией. Для решения этих проблем с конфиденциальностью Google предлагает Gemini Nano — уменьшенную, более оптимизированную версию своей модели ИИ, которая работает непосредственно на устройстве, а не на облачном сервере. Хотя до сих пор доступ к Gemini Nano был ограничен одной линией устройства и вводом только текста, Google вскоре значительно расширит его доступность и введет поддержку ввода изображений.

В конце прошлого месяца Google опубликовала список сессий I/O 2025, в который вошла сессия под названием «Gemini Nano на Android: генеративный искусственный интеллект на устройстве». В описании сессии говорится, что в ней «представят новый набор API генеративного ИИ, использующих возможности Gemini Nano. Эти новые API позволяют легко реализовать сценарии использования для обобщения, вычитки и переписывания текста, а также для создания описаний изображений».

В октябре Google открыла экспериментальный доступ к Gemini Nano через AI Edge SDK, позволив сторонним разработчикам экспериментировать с текстовыми подсказками на устройствах серии Pixel 9. AI Edge SDK позволяет использовать такие текстовые функции, как перефразирование, умные ответы, корректура и резюмирование, но не включает поддержку генерации описаний изображений — функцию, которую Google выделил на предстоящей сессии I/O. Таким образом, вполне вероятно, что «новый набор генеративных API», упомянутый в описании сессии, относится либо к чему-то совершенно иному, чем AI Edge SDK, либо к его новой версии. К счастью, нам не придется долго ждать, чтобы узнать об этом.

На прошлой неделе Google без лишнего шума опубликовал документацию по новым API ML Kit. ML Kit — это SDK, который позволяет разработчикам использовать возможности машинного обучения в своих приложениях без необходимости понимать, как работают базовые модели. Новые API позволяют разработчикам «использовать мощь Gemini Nano для обеспечения производительности «из коробки» при решении обычных задач с помощью упрощенного высокоуровневого интерфейса». Как и AI Edge SDK, он «построен на AICore», позволяя «выполнять на устройстве базовые модели ИИ, такие как Gemini Nano, повышая функциональность приложений и конфиденциальность пользователей за счет локальной обработки данных».

Другими словами, API от ML Kit упрощает разработчикам использование Gemini Nano для различных функций в своих приложениях в частном порядке и с высокой производительностью. В настоящее время эти функции включают в себя резюмирование, корректуру или переписывание текста, а также генерацию описаний изображений. Все эти четыре функции соответствуют тому, что упоминается в описании сессии I/O, что позволяет предположить, что Google намерена официально анонсировать API генеративного ИИ в ML Kit на следующей неделе.

По сравнению с существующим AI Edge SDK, GenAI API в ML Kit будут предлагаться в «бета-версии», а не в «экспериментальном доступе». Это обозначение «бета» может означать, что Google разрешит приложениям использовать новые GenAI API в продакшене. В настоящее время разработчики не могут выпускать приложения с использованием AI Edge SDK, что означает, что ни одно стороннее приложение не может использовать Gemini Nano в данный момент. Еще одно отличие заключается в том, что AI Edge SDK ограничен текстовым вводом, в то время как GenAI API ML Kit поддерживает изображения. Поддержка изображений обеспечивает функцию описания изображений, позволяющую приложениям генерировать краткие описания любого изображения.

Однако самое большое различие между текущей версией AI Edge SDK и GenAI API ML Kit заключается в поддержке устройств. Если AI Edge SDK поддерживает только серию Google Pixel 9, то ML Kit GenAI API можно использовать на любом Android-телефоне, поддерживающем мультимодальную модель Gemini Nano. К ним относятся такие устройства, как HONOR Magic 7, Motorola Razr 60 Ultra, OnePlus 13, Samsung Galaxy S25, Xiaomi 15 и другие.

Если вы нашли опечатку - выделите ее и нажмите Ctrl + Enter! Для связи с нами вы можете использовать info@apptractor.ru.