Google dévoile un modèle d'IA open source ultra-petit et efficace, Gemma 3 270M, qui peut fonctionner sur les smartphones

14 août 2025 11h21

Crédit : VentureBeat réalisé avec Midjourney

Envie d'informations plus pertinentes dans votre boîte mail ? Inscrivez-vous à nos newsletters hebdomadaires pour recevoir uniquement les informations essentielles pour les leaders de l'IA, des données et de la sécurité en entreprise. Abonnez-vous maintenant.

L'équipe de recherche DeepMind AI de Google a dévoilé aujourd'hui un nouveau modèle d'IA open source, Gemma 3 270M.

Comme son nom l'indique, il s'agit d'un modèle de 270 millions de paramètres , bien plus petit que les 70 milliards de paramètres ou plus de nombreux LLM de frontière (les paramètres étant le nombre de paramètres internes régissant le comportement du modèle).

Alors que davantage de paramètres se traduisent généralement par un modèle plus grand et plus puissant, l'objectif de Google est presque le contraire : une efficacité élevée, offrant aux développeurs un modèle suffisamment petit pour fonctionner directement sur les smartphones et localement , sans connexion Internet , comme le montrent les tests internes sur un Pixel 9 Pro SoC.

Pourtant, le modèle est toujours capable de gérer des tâches complexes et spécifiques à un domaine et peut être rapidement affiné en quelques minutes pour répondre aux besoins d'une entreprise ou d'un développeur indépendant.

La mise à l'échelle de l'IA atteint ses limites

Les plafonds de puissance, la hausse du coût des jetons et les délais d'inférence transforment l'IA d'entreprise. Participez à notre salon exclusif pour découvrir comment les meilleures équipes :

Transformer l'énergie en avantage stratégique
Concevoir une inférence efficace pour des gains de débit réels
Libérer un retour sur investissement compétitif grâce à des systèmes d'IA durables

Réservez votre place pour garder une longueur d'avance : https://bit.ly/4mwGngO

Sur le réseau social X , Omar Sanseviero, ingénieur en relations avec les développeurs d'IA de Google DeepMind Staff, a ajouté que le Gemma 3 270M peut également fonctionner directement dans le navigateur Web d'un utilisateur, sur un Raspberry Pi et « dans votre grille-pain », soulignant sa capacité à fonctionner sur du matériel très léger.

– Omar Sanseviero (@osanseviero) 14 août 2025

Gemma 3 270M combine 170 millions de paramètres d'intégration — grâce à un large vocabulaire de 256 000 capable de gérer des jetons rares et spécifiques — avec 100 millions de paramètres de bloc de transformateur.

Selon Google, l'architecture prend en charge de solides performances sur les tâches de suivi d'instructions dès la sortie de la boîte, tout en restant suffisamment petite pour un réglage précis et un déploiement rapides sur des appareils aux ressources limitées, y compris le matériel mobile.

Gemma 3 270M hérite de l'architecture et du pré-entraînement des modèles Gemma 3 plus importants, garantissant ainsi la compatibilité avec l'ensemble de l'écosystème Gemma. Grâce à la documentation, aux recettes de réglage fin et aux guides de déploiement disponibles pour des outils comme Hugging Face, UnSloth et JAX, les développeurs peuvent passer rapidement de l'expérimentation au déploiement.

Sur le benchmark IFEval, qui mesure la capacité d'un modèle à suivre des instructions , le Gemma 3 270M, réglé sur les instructions, a obtenu un score de 51,2 % .

Le score le place bien au-dessus de modèles de taille similaire comme SmolLM2 135M Instruct et Qwen 2.5 0.5B Instruct , et plus proche de la plage de performances de certains modèles à milliards de paramètres, selon la comparaison publiée par Google.

Cependant, comme l'ont souligné les chercheurs et les dirigeants de la startup rivale d'IA Liquid AI dans leurs réponses sur X, Google a laissé de côté le modèle LFM2-350M de Liquid, sorti en juillet de cette année, qui a obtenu un score impressionnant de 65,12 % avec seulement quelques paramètres supplémentaires (modèle de langage de taille similaire, cependant).

L'un des atouts majeurs du modèle réside dans son efficacité énergétique. Lors de tests internes utilisant le modèle quantifié INT4 sur un SoC Pixel 9 Pro, 25 conversations n'ont consommé que 0,75 % de la batterie de l'appareil.

Cela fait du Gemma 3 270M un choix pratique pour l'IA sur l'appareil, en particulier dans les cas où la confidentialité et la fonctionnalité hors ligne sont importantes.

La version comprend à la fois un modèle pré-entraîné et un modèle optimisé pour les instructions, offrant aux développeurs une utilité immédiate pour les tâches générales de suivi des instructions.

Des points de contrôle formés à la quantification (QAT) sont également disponibles, permettant une précision INT4 avec une perte de performances minimale et rendant le modèle prêt pour la production pour les environnements à ressources limitées.

Google présente Gemma 3 270M dans le cadre d'une philosophie plus large consistant à choisir l'outil adapté au travail plutôt que de se fier à la taille brute du modèle.

Pour des fonctions telles que l'analyse des sentiments, l'extraction d'entités, le routage des requêtes, la génération de texte structuré, les contrôles de conformité et l'écriture créative, la société affirme qu'un petit modèle affiné peut fournir des résultats plus rapides et plus rentables qu'un grand modèle à usage général.

Les avantages de la spécialisation sont évidents dans les travaux passés, comme la collaboration d’Adaptive ML avec SK Telecom.

En affinant un modèle Gemma 3 4B pour la modération de contenu multilingue, l’équipe a surpassé des systèmes propriétaires beaucoup plus grands.

Le Gemma 3 270M est conçu pour permettre un succès similaire à une échelle encore plus petite, en prenant en charge des flottes de modèles spécialisés adaptés à des tâches individuelles.

L'application de démonstration Bedtime Story Generator montre le potentiel de Gemma 3 270M

Au-delà de l'utilisation en entreprise, le modèle s'adapte également à des scénarios créatifs. Dans une vidéo de démonstration publiée sur YouTube , Google présente une application Bedtime Story Generator, développée avec Gemma 3 270M et Transformers.js, qui fonctionne entièrement hors ligne dans un navigateur web, démontrant ainsi la polyvalence du modèle dans des applications légères et accessibles.

La vidéo met en évidence la capacité du modèle à synthétiser plusieurs entrées en permettant des sélections pour un personnage principal (par exemple, « un chat magique »), un décor (« dans une forêt enchantée »), un rebondissement (« découvre une porte secrète »), un thème (« Aventureux ») et une longueur souhaitée (« Court »).

Une fois les paramètres définis, le modèle Gemma 3 270M génère une histoire cohérente et imaginative. L'application tisse ensuite un court récit aventureux basé sur les choix de l'utilisateur, démontrant ainsi la capacité du modèle à générer du texte créatif et contextuel.

Cette vidéo sert d'exemple puissant de la manière dont le Gemma 3 270M, léger mais performant, peut alimenter des applications rapides, attrayantes et interactives sans dépendre du cloud , ouvrant ainsi de nouvelles possibilités pour les expériences d'IA sur l'appareil.

Gemma 3 270M est publié sous les conditions d'utilisation de Gemma, qui autorisent l'utilisation, la reproduction, la modification et la distribution du modèle et des dérivés, à condition que certaines conditions soient remplies.

Il s'agit notamment de reporter les restrictions d'utilisation décrites dans la politique d'utilisation interdite de Google, de fournir les conditions d'utilisation aux destinataires en aval et d'indiquer clairement toute modification apportée. La distribution peut être directe ou via des services hébergés tels que des API ou des applications web.

Pour les équipes d'entreprise et les développeurs commerciaux, cela signifie que le modèle peut être intégré à des produits, déployé dans le cadre de services cloud ou perfectionné pour créer des dérivés spécialisés, à condition que les conditions de licence soient respectées. Les résultats générés par le modèle ne sont pas revendiqués par Google, ce qui confère aux entreprises tous les droits sur le contenu qu'elles créent.

Toutefois, les développeurs sont responsables de garantir le respect des lois applicables et d’éviter les utilisations interdites, telles que la génération de contenu préjudiciable ou la violation des règles de confidentialité.

La licence n'est pas open source au sens traditionnel du terme, mais elle permet une utilisation commerciale étendue sans licence payante distincte.

Pour les entreprises qui créent des applications d’IA commerciales, les principales considérations opérationnelles sont de s’assurer que les utilisateurs finaux sont liés par des restrictions équivalentes, de documenter les modifications du modèle et de mettre en œuvre des mesures de sécurité alignées sur la politique d’utilisations interdites.

Avec le Gemmaverse dépassant les 200 millions de téléchargements et la gamme Gemma couvrant des variantes optimisées pour le cloud, le bureau et le mobile, les développeurs d'IA de Google positionnent Gemma 3 270M comme une base pour la création de solutions d'IA rapides, rentables et axées sur la confidentialité, et déjà, cela semble bien parti.

Informations quotidiennes sur les cas d'utilisation métier avec VB Daily

Si vous souhaitez impressionner votre patron, VB Daily a tout prévu. Nous vous présentons en avant-première les avancées des entreprises en matière d'IA générative, des évolutions réglementaires aux déploiements pratiques, afin que vous puissiez partager vos idées pour un retour sur investissement maximal.

Lisez notre politique de confidentialité

Merci de votre abonnement. Découvrez d'autres newsletters VB ici .

Une erreur s'est produite.

venturebeat

Google dévoile un modèle d'IA open source ultra-petit et efficace, Gemma 3 270M, qui peut fonctionner sur les smartphones

14 août 2025 11h21

Crédit : VentureBeat réalisé avec Midjourney

L'équipe de recherche DeepMind AI de Google a dévoilé aujourd'hui un nouveau modèle d'IA open source, Gemma 3 270M.

La mise à l'échelle de l'IA atteint ses limites

Transformer l'énergie en avantage stratégique
Concevoir une inférence efficace pour des gains de débit réels
Libérer un retour sur investissement compétitif grâce à des systèmes d'IA durables