Home » Google a un nouveau modèle d’IA open-source – Peut-il concurrencer le Llama-2 de Meta ?

Google a un nouveau modèle d’IA open-source – Peut-il concurrencer le Llama-2 de Meta ?

by v

Google AI, une division du géant de la recherche, a dévoilé aujourd’hui Gemma, une nouvelle famille de modèles de langage open-source dérivés de sa récente suite d’outils d’IA Gemini. Avec Gemma, Google s’attaque directement à la position de leader des LLM basés sur LLaMa et Mistral de Meta.

« Nous soutenons depuis longtemps l’open source et la science responsables, qui permettent de faire progresser rapidement la recherche », a écrit Demis Hassabis, cofondateur de Google DeepMind, dans un tweet. « Nous sommes donc fiers de publier Gemma : un ensemble de modèles ouverts légers, les meilleurs de leur catégorie pour leur taille, inspirés par la même technologie que celle utilisée pour Gemini. »

Gemini est le LLM multimodal commercial à code source fermé récemment publié par Google pour remplacer PaLM-2 dans sa suite de services en ligne, en concurrence directe avec ChatGPT Plus d’OpenAI.

Gemma est disponible en deux versions : Gemma 2B, un modèle léger entraîné sur deux milliards de paramètres, optimisé pour l’efficacité et pouvant être exécuté sur un plus large éventail de matériel, et Gemma 7B, un modèle plus robuste entraîné sur 7 milliards de paramètres, qui fournit de meilleurs résultats mais nécessite une plus grande puissance de calcul.

« Chez Google, nous croyons qu’il faut rendre l’IA utile pour tout le monde », a déclaré Google dans un communiqué officiel, soulignant sa vision de la démocratisation de la technologie de l’IA.

La publication d’un modèle open source peut avoir un impact plus immédiat sur les développeurs d’IA et les ingénieurs logiciels, mais les avantages atteignent les utilisateurs finaux une fois qu’ils ont été testés, affinés et intégrés dans des produits et services.

« Au fur et à mesure que nous élargissons la famille de modèles Gemma, nous avons hâte d’introduire de nouvelles variantes pour diverses applications », a ajouté l’entreprise.

L’annonce de Google couvre les fondements techniques et philosophiques de Gemma, précisant que le modèle « est conçu en fonction de nos principes d’IA ».

« Pour comprendre et réduire le profil de risque des modèles Gemma, nous avons procédé à des évaluations solides, notamment des tests manuels en équipe restreinte, des tests automatisés d’adversité et des évaluations des capacités des modèles pour les activités dangereuses », a déclaré l’entreprise.

Peu après sa sortie, Gemma a rapidement grimpé les échelons du classement Hugging Face, atteignant la deuxième place dans la liste des tendances et battant tous les autres LLM et modèles d’IA open source, à l’exception d’Open Cascade de Stability AI, une nouvelle IA génératrice de texte à partir d’images.

Des chiffres réels confirment les prouesses revendiquées par Gemma : il a démontré des performances supérieures à celles du LlaMa-2 de Meta sur plusieurs critères de référence synthétiques. Par exemple, Gemma surpasse LlaMa-2 dans des tests tels que MMLU (connaissances couvrant 57 disciplines scientifiques), Hellaswag (évaluation du raisonnement de base dans les tâches quotidiennes), MATH (évaluation des capacités mathématiques) et HumanEval (test des compétences en codage).

Image : Google

Image : Google


Les développeurs souhaitant tester Gemma peuvent le faire gratuitement en utilisant Kaggle, une plateforme de science des données et d’intelligence artificielle créée par Google. L’entreprise a également mis Gemma à disposition via les carnets Google Colab et offre 300 dollars de crédits aux nouveaux utilisateurs de Google Cloud.

« Les chercheurs peuvent également demander des crédits Google Cloud allant jusqu’à 500 000 dollars pour accélérer leurs projets », a déclaré Google.

Related Posts

Leave a Comment