Home » Google ma nowy model AI o otwartym kodzie źródłowym – czy może konkurować z Llama-2 firmy Meta?

Google ma nowy model AI o otwartym kodzie źródłowym – czy może konkurować z Llama-2 firmy Meta?

by Thomas

Google AI – oddział wyszukiwarkowego giganta – zaprezentował dziś Gemmę, nową rodzinę modeli językowych typu open-source wywodzących się z niedawno wydanego pakietu narzędzi AI Gemini. Dzięki Gemmie Google bezpośrednio kwestionuje wiodącą pozycję LLM opartych na LLaMa i Mistral firmy Meta.

„Mamy długą historię wspierania odpowiedzialnego open source i nauki, która może napędzać szybki postęp badań” – napisał w tweecie Demis Hassabis, współzałożyciel Google DeepMind. „Z dumą wypuszczamy więc Gemmę: zestaw lekkich otwartych modeli, najlepszych w swojej klasie pod względem rozmiaru, inspirowanych tą samą technologią, której użyto w Gemini”.

Gemini to komercyjny, multimodalny LLM o zamkniętym kodzie źródłowym, wydany niedawno przez Google w celu zastąpienia PaLM-2 w zasilaniu pakietu usług online, konkurując bezpośrednio z ChatGPT Plus OpenAI.

Gemma jest dostępna w dwóch wersjach: Gemma 2B, lekki model trenowany na dwóch miliardach parametrów, który jest zoptymalizowany pod kątem wydajności i może być uruchamiany w szerszym spektrum sprzętu, oraz Gemma 7B, bardziej solidny model trenowany na 7 miliardach parametrów, który zapewnia lepsze wyniki, ale wymaga większej mocy obliczeniowej.

„W Google wierzymy, że sztuczna inteligencja może być pomocna dla każdego” – powiedział Google w oficjalnym komunikacie, podkreślając swoją wizję demokratyzacji technologii AI.

Udostępnienie modelu open source może mieć natychmiastowy wpływ na programistów AI i inżynierów oprogramowania, ale korzyści docierają do użytkowników końcowych po przetestowaniu, dopracowaniu i wbudowaniu w produkty i usługi.

„Kontynuując rozszerzanie rodziny modeli Gemma, z niecierpliwością czekamy na wprowadzenie nowych wariantów dla różnych zastosowań” – dodała firma.

Ogłoszenie Google obejmowało techniczne i filozoficzne podstawy Gemmy, mówiąc, że model „został zaprojektowany z naszymi zasadami sztucznej inteligencji na czele”.

„Aby zrozumieć i zmniejszyć profil ryzyka dla modeli Gemma, przeprowadziliśmy solidne oceny, w tym ręczny red-teaming, zautomatyzowane testy kontradyktoryjności i oceny możliwości modelu pod kątem niebezpiecznych działań” – czytamy w komunikacie.

Wkrótce po premierze Gemma szybko wspięła się w rankingach na często przywoływanej tablicy wyników Hugging Face, osiągając drugie miejsce na liście trendów i pokonując wszystkie inne modele LLM i AI typu open source – z wyjątkiem Open Cascade firmy Stability AI, nowej generatywnej sztucznej inteligencji typu tekst-obraz.

Prawdziwe liczby potwierdzają rzekomą sprawność Gemmy: wykazała ona wyższą wydajność niż LlaMa-2 firmy Meta w kilku syntetycznych testach porównawczych. Na przykład Gemma przewyższa LlaMa-2 w testach takich jak MMLU (wiedza obejmująca 57 dyscyplin naukowych), Hellaswag (ocena podstawowego rozumowania w codziennych zadaniach), MATH (ocena zdolności matematycznych) i HumanEval (testowanie biegłości w kodowaniu).

Image: Google

Image: Google


Deweloperzy zainteresowani przetestowaniem Gemmy mogą to zrobić za darmo za pomocą Kaggle, platformy do nauki o danych i sztucznej inteligencji stworzonej przez Google. Firma udostępniła również Gemmę za pośrednictwem notebooków Google Colab i daje 300 USD kredytów dla nowych użytkowników Google Cloud.

„Naukowcy mogą również ubiegać się o kredyty Google Cloud w wysokości do 500 000 USD, aby przyspieszyć swoje projekty” – powiedział Google.

Related Posts

Leave a Comment