Home » Google cuenta con un nuevo modelo de IA de código abierto. ¿Podrá competir con Llama-2 de Meta?

Google cuenta con un nuevo modelo de IA de código abierto. ¿Podrá competir con Llama-2 de Meta?

by Thomas

Google AI -una división del gigante de las búsquedas- ha presentado hoy Gemma, una nueva familia de modelos lingüísticos de código abierto derivados de su conjunto de herramientas de IA Gemini, recientemente publicado. Con Gemma, Google desafía directamente la posición de liderazgo de los LLM basados en LLaMa y Mistral de Meta.

«Tenemos una larga historia de apoyo al código abierto responsable y a la ciencia, que puede impulsar el rápido progreso de la investigación», escribió Demis Hassabis, cofundador de Google DeepMind, en un tuit. «Así que estamos orgullosos de lanzar Gemma: un conjunto de modelos abiertos ligeros, los mejores de su clase para su tamaño, inspirados en la misma tecnología utilizada para Gemini».

Gemini es el LLM multimodal comercial de código cerrado lanzado recientemente por Google para sustituir a PaLM-2 en la alimentación de su conjunto de servicios en línea, compitiendo directamente contra ChatGPT Plus de OpenAI.

Gemma está disponible en dos versiones: Gemma 2B, un modelo ligero entrenado en dos mil millones de parámetros que está optimizado para la eficiencia y se puede ejecutar en un espectro más amplio de hardware, y Gemma 7B, un modelo más robusto entrenado en 7 mil millones de parámetros, que proporciona mejores resultados pero requiere más potencia de cálculo.

«En Google, creemos en hacer que la IA sea útil para todos», dijo Google en un anuncio oficial, haciendo hincapié en su visión de democratizar la tecnología de IA.

La liberación de un modelo de código abierto puede tener un impacto más inmediato en los desarrolladores de IA y los ingenieros de software, pero los beneficios llegan a los usuarios finales después de haber sido probados, afinados e incorporados a productos y servicios.

«A medida que sigamos ampliando la familia de modelos Gemma, esperamos introducir nuevas variantes para diversas aplicaciones», añadió la empresa.

El anuncio de Google cubría los fundamentos técnicos y filosóficos de Gemma, afirmando que el modelo «está diseñado con nuestros Principios de IA a la vanguardia».

«Para comprender y reducir el perfil de riesgo de los modelos Gemma, hemos llevado a cabo sólidas evaluaciones que incluyen red-teaming manual, pruebas de adversarios automatizadas y evaluaciones de las capacidades del modelo para actividades peligrosas».

Poco después de su lanzamiento, Gemma ascendió rápidamente en la clasificación de Hugging Face, alcanzando el segundo puesto en la lista de tendencias y superando a todos los demás LLM y modelos de IA de código abierto, excepto a Open Cascade de Stability AI, una nueva IA generativa de texto a imagen.

Las cifras reales avalan las proezas de Gemma: ha demostrado un rendimiento superior al de LlaMa-2 de Meta en varias pruebas sintéticas. Por ejemplo, Gemma supera a LlaMa-2 en pruebas como MMLU (conocimientos que abarcan 57 disciplinas científicas), Hellaswag (evaluación del razonamiento básico en tareas cotidianas), MATH (evaluación de las capacidades matemáticas) y HumanEval (prueba de la capacidad de codificación).

Imagen: Google

Imagen: Google


Los desarrolladores interesados en probar Gemma pueden hacerlo gratuitamente a través de Kaggle, una plataforma de ciencia de datos e inteligencia artificial creada por Google. La compañía también ha puesto Gemma a disposición a través de cuadernos Google Colab, y está dando $ 300 en créditos para los usuarios de Google Cloud por primera vez.

«Los investigadores también pueden solicitar créditos de Google Cloud de hasta 500.000 dólares para acelerar sus proyectos», dijo Google.

Related Posts

Leave a Comment