Home » Para além do Bard: Google lança Gemini, uma IA multimodal para desafiar o ChatGPT

Para além do Bard: Google lança Gemini, uma IA multimodal para desafiar o ChatGPT

by Thomas

O Google surpreendeu o mundo da tecnologia na quarta-feira com a estreia do Gemini, o seu conjunto de ferramentas de inteligência artificial multimodal para consumidores e empresas.

Entre os gigantes da tecnologia que se lançaram agressivamente na IA, o titã das pesquisas Google parecia estar a nadar no espaço intermédio, enquanto a OpenAI, apoiada pela Microsoft, empurrava o ChatGPT para o Turbo e o Vision e o Anthropic actualizavam o Claude. A partir de hoje, a Google lança três versões do Gemini – Nano, Pro e Ultra – que compreendem e integram perfeitamente texto, imagens, áudio e vídeo.

O Gemini parece estar preparado para superar os modelos de IA topo de gama da OpenAI, que acabou de lançar uma lista extensa de novas capacidades, mas que pouco depois ficou enterrada em intrigas empresariais.

A versão mais avançada, Gemini Ultra, apresentou bons resultados em vários testes de referência populares, igualando ou excedendo o desempenho humano em alguns casos. Por exemplo, estabeleceu novos recordes em 30 dos 32 testes de referência no exame MMLU, que abrange uma variedade de disciplinas académicas.

O Google Gemini apresenta excelentes resultados em testes de IA. Imagem: Google” src=”https://www.todayscrypto.news/wp-content/uploads/2024/01/1.Captura-de-pantalla-2023-12-06-1.jpg” width=”828″ height=”595″ /☻

Em contrapartida, as primeiras avaliações qualitativas do Gemini revelam a sua notável capacidade para efetuar raciocínios intermodais. Por exemplo, em contextos educativos, o Gemini consegue compreender problemas complexos de física, convertendo-os em fórmulas matemáticas e fornecendo soluções correctas. Esta capacidade abre caminhos transformadores na educação, bem como noutros domínios.

Os LLMs tradicionais não são normalmente muito bons em matemática, pelo que as capacidades de raciocínio da família Gemini de LLMs multimodais merecem alguma atenção.

Noutro teste de referência centrado na compreensão da linguagem multimodal, o Gemini Ultra obteve uma precisão superior a 90%, ultrapassando outros modelos existentes. A Google afirma que os testes de preferência humana também mostraram uma clara preferência pelo Gemini em relação a modelos como o PaLM 2 em áreas como a escrita criativa.

O serviço mais pequeno, o Gemini Nano, foi concebido para ser eficiente no dispositivo, destacando-se em resumos, compreensão de leitura e várias tarefas de raciocínio. Apesar do seu tamanho mais pequeno, o Gemini Nano apresenta um desempenho notável em comparação com o modelo Gemini Pro, de maiores dimensões. Isto significa que o Gemini pode tornar-se a IA preferida para alimentar assistentes móveis que podem ou devem trabalhar offline.

O Gemini parece ser uma estreia muito forte, sob qualquer ponto de vista. E à medida que as capacidades de IA da Google forem sendo melhoradas, a sua versatilidade poderá permitir novas aplicações em muitos domínios. No entanto, por enquanto, são necessários mais testes no mundo real para determinar os seus níveis de desempenho realistas.

Os utilizadores podem testar hoje uma versão aperfeiçoada do Gemini Pro com a Bard. O Gemini Ultra será lançado no próximo ano numa nova versão do chatbot da Google chamada Bard Advanced. A Google espera lançar o Gemini em mais de 170 idiomas diferentes e utilizar a tecnologia para alimentar a sua linha Pixel e a Search Generative Experience.

Related Posts

Leave a Comment