Home » A Google tem um novo modelo de IA de código aberto – poderá competir com o Llama-2 da Meta?

A Google tem um novo modelo de IA de código aberto – poderá competir com o Llama-2 da Meta?

by Thomas

A Google AI – uma divisão do gigante das pesquisas – apresentou hoje o Gemma, uma nova família de modelos linguísticos de código aberto derivados do seu conjunto de ferramentas de IA Gemini, recentemente lançado. Com o Gemma, a Google desafia diretamente a posição de liderança dos LLM baseados no LLaMa e no Mistral da Meta.

“Temos uma longa história de apoio à ciência e ao código aberto responsável, que pode impulsionar o rápido progresso da investigação”, escreveu Demis Hassabis, cofundador do Google DeepMind, num tweet. “Por isso, temos o orgulho de lançar o Gemma: um conjunto de modelos abertos leves, os melhores da sua classe para o seu tamanho, inspirados pela mesma tecnologia utilizada no Gemini.”

Gemini é o LLM comercial multimodal de código fechado lançado recentemente pela Google para substituir o PaLM-2 na alimentação do seu conjunto de serviços online, competindo diretamente com o ChatGPT Plus da OpenAI.

O Gemma está disponível em duas versões: Gemma 2B, um modelo leve treinado em dois mil milhões de parâmetros que está optimizado para ser eficiente e pode ser executado num espetro mais amplo de hardware, e Gemma 7B, um modelo mais robusto treinado em 7 mil milhões de parâmetros, que fornece melhores resultados mas requer mais poder de computação.

“No Google, acreditamos em tornar a IA útil para todos”, disse o Google em um anúncio oficial, enfatizando sua visão de democratizar a tecnologia de IA.

O lançamento de um modelo de código aberto pode ter um impacto mais imediato nos programadores de IA e nos engenheiros de software, mas os benefícios chegam aos utilizadores finais depois de terem sido testados, afinados e integrados em produtos e serviços.

“À medida que continuamos a expandir a família de modelos Gemma, esperamos apresentar novas variantes para diversas aplicações”, acrescentou a empresa.

O anúncio da Google abrangeu os fundamentos técnicos e filosóficos do Gemma, afirmando que o modelo “foi concebido com os nossos princípios de IA na vanguarda”.

“Para entender e reduzir o perfil de risco dos modelos Gemma, conduzimos avaliações robustas, incluindo red-teaming manual, testes adversários automatizados e avaliações das capacidades do modelo para atividades perigosas”, disse.

Pouco depois do seu lançamento, o Gemma subiu rapidamente na tabela de classificação do Hugging Face, alcançando o segundo lugar na lista de tendências e batendo todos os outros LLMs de código aberto e modelos de IA – exceto o Open Cascade da Stability AI, uma nova IA geradora de texto para imagem.

Os números reais confirmam as alegadas proezas do Gemma: demonstrou um desempenho superior ao LlaMa-2 da Meta em vários benchmarks sintéticos. Por exemplo, o Gemma supera o LlaMa-2 em testes como o MMLU (conhecimento que abrange 57 disciplinas científicas), Hellaswag (avaliação do raciocínio básico em tarefas quotidianas), MATH (avaliação das capacidades matemáticas) e HumanEval (teste de proficiência em codificação).

Imagem: Google

Imagem: Google


Os programadores interessados em testar o Gemma podem fazê-lo gratuitamente através do Kaggle, uma plataforma de ciência de dados e inteligência artificial criada pela Google. A empresa também disponibilizou o Gemma através dos notebooks do Google Colab e está a oferecer 300 dólares em créditos para os primeiros utilizadores do Google Cloud.

“Os investigadores podem também candidatar-se a créditos Google Cloud até 500.000 dólares para acelerar os seus projectos”, afirmou a Google.

Related Posts

Leave a Comment