Google AI – divize vyhledávacího gigantu – dnes představila Gemmu, novou rodinu jazykových modelů s otevřeným zdrojovým kódem odvozených z nedávno vydané sady nástrojů AI Gemini. S modelem Gemma společnost Google přímo vyzývá vedoucí postavení modelů LLM založených na modelech LLaMa a Mistral společnosti Meta.
„Dlouhodobě podporujeme zodpovědný open source a vědu, která může být hnací silou rychlého pokroku ve výzkumu,“ napsal na Twitteru Demis Hassabis, spoluzakladatel Google DeepMind. „Proto jsme hrdí na to, že můžeme vydat Gemmu: sadu lehkých otevřených modelů, nejlepších ve své třídě vzhledem ke své velikosti, inspirovaných stejnou technologií, která byla použita pro Gemini.“
Gemini je komerční multimodální LLM s uzavřeným zdrojovým kódem, který nedávno vydala společnost Google, aby nahradil PaLM-2 v pohonu její sady online služeb a přímo konkuroval ChatGPT Plus společnosti OpenAI.
Gemma je k dispozici ve dvou verzích: Gemma 2B, odlehčený model natrénovaný na dvou miliardách parametrů, který je optimalizován pro efektivitu a lze jej provozovat v širším spektru hardwaru, a Gemma 7B, robustnější model natrénovaný na 7 miliardách parametrů, který poskytuje lepší výsledky, ale vyžaduje větší výpočetní výkon.
„Ve společnosti Google věříme, že umělá inteligence bude užitečná pro každého,“ uvedla společnost Google v oficiálním oznámení a zdůraznila svou vizi demokratizace technologie umělé inteligence.
Zveřejnění modelu s otevřeným zdrojovým kódem může mít bezprostřednější dopad na vývojáře AI a softwarové inženýry, ale výhody se ke koncovým uživatelům dostanou až po jeho otestování, vyladění a zabudování do produktů a služeb.
„Jak budeme pokračovat v rozšiřování rodiny modelů Gemma, těšíme se na představení nových variant pro různorodé aplikace,“ dodala společnost.
Oznámení společnosti Google se týkalo technických a filozofických základů modelu Gemma a uvádělo, že model „je navržen s ohledem na naše zásady umělé inteligence v popředí“.
„Abychom pochopili a snížili rizikový profil modelů Gemma, provedli jsme důkladná hodnocení, včetně manuálního red-teamingu, automatizovaného testování protivníků a posouzení schopností modelů pro nebezpečné činnosti,“ uvedla společnost.
Krátce po svém vydání se Gemma rychle vyšplhala na žebříčku často zmiňovaného portálu Hugging Face, dosáhla na druhé místo v seznamu trendů a porazila všechny ostatní open source LLM a modely AI – s výjimkou Open Cascade od Stability AI, nové generativní AI pro převod textu na obraz.
Proklamovanou zdatnost modelu Gemma potvrzují reálná čísla: v několika syntetických benchmarcích prokázal vyšší výkon než model LlaMa-2 společnosti Meta. Gemma například překonává LlaMa-2 v testech jako MMLU (znalosti pokrývající 57 vědeckých disciplín), Hellaswag (hodnocení základního uvažování v každodenních úlohách), MATH (hodnocení matematických schopností) a HumanEval (testování znalostí kódování).
Vývojáři, kteří mají zájem Gemmu otestovat, tak mohou učinit zdarma pomocí platformy Kaggle, kterou vytvořila společnost Google pro datovou vědu a umělou inteligenci. Společnost také zpřístupnila Gemmu prostřednictvím notebooků Google Colab a pro první uživatele služby Google Cloud poskytuje kredity ve výši 300 dolarů.
„Výzkumní pracovníci mohou také požádat o kredity Google Cloud až do výše 500 000 dolarů na urychlení svých projektů,“ uvedla společnost Google.