Google почала впроваджувати інструменти для інтеграції генеративного ШІ прямо в мобільні додатки – без залежності від хмарних серверів. В оновлений ML Kit SDK додано підтримку Gemini Nano, компактної мовної моделі, яка працює виключно на пристрої. Це дасть змогу створювати функції на кшталт коротких текстових зведень, перефразування або опису зображень, зберігаючи дані користувача в безпеці.
Головна перевага підходу – конфіденційність. Все, від введення запиту до отримання результату, обробляється локально. Наприклад, зведення повідомлень або редагування тексту зможуть працювати навіть без інтернету. Однак можливості Gemini Nano скромніші за хмарні аналоги: текстові висновки обмежені трьома пунктами, а опис картинок поки що доступний тільки англійською. Крім того, продуктивність залежить від версії моделі: найлегша (XXS) займає близько 25 МБ і працює тільки з текстом, тоді як стандартна (XS) вимагає 100 МБ пам’яті.
Зараз модель підтримується на Google Pixel 9a, Samsung Galaxy S25, Xiaomi 15 та інших флагманах. Список пристроїв буде розширюватися, як і набір застосунків із локальним ШІ. Розробники вже можуть тестувати API в бета-версії, але варто врахувати обмеження: застосункам виділяється квота на запити, а фонові завдання блокуються. Наприклад, якщо користувач згорне програму, АІ-функції призупиняться.


Цікаво, що Google не перша намагається впровадити локальний ШІ: Qualcomm і MediaTek пропонують свої рішення, але їх складно адаптувати під різні пристрої. Gemini Nano через ML Kit спрощує завдання – розробникам не потрібно створювати моделі з нуля або оптимізувати їх під кожне залізо. Проте масовому поширенню заважає брак обчислювальної потужності у багатьох смартфонів.
Практичну користь технології вже видно: наприклад, Pixel аналізує скріншоти прямо на пристрої, а Motorola Razr Ultra генерує зведення повідомлень офлайн. З виходом Gemini Nano такі функції можуть стати стандартом, але для їхньої стабільної роботи потрібен час – як з боку розробників, так і виробників заліза

