Home » Google má nový open-source model umělé inteligence – může konkurovat modelu Llama-2 společnosti Meta?

Google má nový open-source model umělé inteligence – může konkurovat modelu Llama-2 společnosti Meta?

by v

Google AI – divize vyhledávacího gigantu – dnes představila Gemmu, novou rodinu jazykových modelů s otevřeným zdrojovým kódem odvozených z nedávno vydané sady nástrojů AI Gemini. S modelem Gemma společnost Google přímo vyzývá vedoucí postavení modelů LLM založených na modelech LLaMa a Mistral společnosti Meta.

„Dlouhodobě podporujeme zodpovědný open source a vědu, která může být hnací silou rychlého pokroku ve výzkumu,“ napsal na Twitteru Demis Hassabis, spoluzakladatel Google DeepMind. „Proto jsme hrdí na to, že můžeme vydat Gemmu: sadu lehkých otevřených modelů, nejlepších ve své třídě vzhledem ke své velikosti, inspirovaných stejnou technologií, která byla použita pro Gemini.“

Gemini je komerční multimodální LLM s uzavřeným zdrojovým kódem, který nedávno vydala společnost Google, aby nahradil PaLM-2 v pohonu její sady online služeb a přímo konkuroval ChatGPT Plus společnosti OpenAI.

Gemma je k dispozici ve dvou verzích: Gemma 2B, odlehčený model natrénovaný na dvou miliardách parametrů, který je optimalizován pro efektivitu a lze jej provozovat v širším spektru hardwaru, a Gemma 7B, robustnější model natrénovaný na 7 miliardách parametrů, který poskytuje lepší výsledky, ale vyžaduje větší výpočetní výkon.

„Ve společnosti Google věříme, že umělá inteligence bude užitečná pro každého,“ uvedla společnost Google v oficiálním oznámení a zdůraznila svou vizi demokratizace technologie umělé inteligence.

Zveřejnění modelu s otevřeným zdrojovým kódem může mít bezprostřednější dopad na vývojáře AI a softwarové inženýry, ale výhody se ke koncovým uživatelům dostanou až po jeho otestování, vyladění a zabudování do produktů a služeb.

„Jak budeme pokračovat v rozšiřování rodiny modelů Gemma, těšíme se na představení nových variant pro různorodé aplikace,“ dodala společnost.

Oznámení společnosti Google se týkalo technických a filozofických základů modelu Gemma a uvádělo, že model „je navržen s ohledem na naše zásady umělé inteligence v popředí“.

„Abychom pochopili a snížili rizikový profil modelů Gemma, provedli jsme důkladná hodnocení, včetně manuálního red-teamingu, automatizovaného testování protivníků a posouzení schopností modelů pro nebezpečné činnosti,“ uvedla společnost.

Krátce po svém vydání se Gemma rychle vyšplhala na žebříčku často zmiňovaného portálu Hugging Face, dosáhla na druhé místo v seznamu trendů a porazila všechny ostatní open source LLM a modely AI – s výjimkou Open Cascade od Stability AI, nové generativní AI pro převod textu na obraz.

Proklamovanou zdatnost modelu Gemma potvrzují reálná čísla: v několika syntetických benchmarcích prokázal vyšší výkon než model LlaMa-2 společnosti Meta. Gemma například překonává LlaMa-2 v testech jako MMLU (znalosti pokrývající 57 vědeckých disciplín), Hellaswag (hodnocení základního uvažování v každodenních úlohách), MATH (hodnocení matematických schopností) a HumanEval (testování znalostí kódování).

Obrázek: Google

Obrázek: Google


Vývojáři, kteří mají zájem Gemmu otestovat, tak mohou učinit zdarma pomocí platformy Kaggle, kterou vytvořila společnost Google pro datovou vědu a umělou inteligenci. Společnost také zpřístupnila Gemmu prostřednictvím notebooků Google Colab a pro první uživatele služby Google Cloud poskytuje kredity ve výši 300 dolarů.

„Výzkumní pracovníci mohou také požádat o kredity Google Cloud až do výše 500 000 dolarů na urychlení svých projektů,“ uvedla společnost Google.

Related Posts

Leave a Comment