Código abierto u OpenAI: ¿cuál es el mejor camino hacia la IA avanzada?

¿Pueden los modelos de inteligencia artificial de código abierto, descentralizados y desguazados competir con los patentados y bien financiados, como el potente GPT-4 de OpenAI? Esta pregunta tan frecuente suscitó un animado debate en Twitter después de que un antiguo investigador de IA de Google tomara partido.

Arnaud Benard, cofundador de Galileo AI, lanzó el guante: «Si crees que los modelos de código abierto vencerán a GPT-4 este año, te equivocas». Benard citó el talento y los recursos de OpenAI y la solidez de GPT-4 como un producto que va más allá de un LLM, y afirmó que los proyectos de código abierto podrían tener dificultades para pasar de aspirantes a campeones de la IA.

si crees que los modelos de código abierto vencerán a gpt-4 este año, te equivocas.

he trabajado en los mejores laboratorios de investigación de ai (google ai) y he creado bibliotecas de código abierto con más de 5 millones de descargas mensuales.

gpt-4 tiene un año y hasta ahora, ningún modelo lo iguala, he aquí por qué:

1. talento – openai reclutó…

– Arnaud Benard (@arnaudai) 1 de enero de 2024

Como era de esperar, el tuit de Benard suscitó reacciones encontradas, que iban desde el apoyo vociferante al desacuerdo feroz.

Ryan Casey, un popular entusiasta de la IA que escribe el boletín «Beyond The Yellow Woods», ofreció una visión más optimista sobre el potencial de la IA de código abierto, afirmando: «El código abierto igualará o superará [a los modelos privados] este año», según sus cálculos. «Si hay demanda, habrá innovación».

Eh, creo que el código abierto igualará o superará este año. pic.twitter.com/y99qKJ2iKF

– Ryan Casey (@ryansweb) 1 de enero de 2024

Por otro lado, el estratega de IA Jeremi Traguna señaló que «los modelos de OpenAI se mantienen en movimiento», y añadió que «a los modelos de código abierto les costará mantener la velocidad para acertar a un objetivo en movimiento en el momento en que el objetivo esté en posición de ser alcanzado». En otras palabras, mientras que los modelos de código abierto podrían estar poniéndose al día con GPT-3.5 en la era de GPT-4, podría haber un GPT-5 para cuando tengamos LLM generalistas que sean comparables a GPT-4.5 Turbo.

Jon Howells, analista tecnológico, cree que los recursos no son la única norma que separa los LLM abiertos de los de código cerrado.

«Mistral cuenta con una enorme financiación, un gran equipo y acaba de lanzar un modelo de código abierto que supera a GPT-3.5», escribió. «Ellos o un equipo similar sacarán un modelo de código abierto de nivel GPT-4 a finales de este año».

Mistral AI, una startup francesa, ha ganado reconocimiento tras lanzar su Mixtral LLM, que ofrece un rendimiento mejorado con respecto a GPT-3.5 en muchos casos de uso.

En un debate, el cofundador de Nous Research, «Teknium», hizo una observación importante, aunque filosófica. «Cada aumento de la capacidad de los sistemas operativos (de código abierto) es algo permanente que nunca se puede quitar al mundo y que se puede utilizar de forma fiable para siempre», afirmó. Básicamente, mientras haya algún avance en la tecnología de IA de código abierto, ninguna empresa puede restringir su acceso.

Presenté juntos y mistral, ninguna de las partes está loco por ello fwiw. Pero este post, que había dicho que ningún modelo de sistema operativo superará GPT-4, pero GPT-4 será noticia vieja – probablemente este año – no nos tomó mucho tiempo para vencer a 3,5, y Mistral CEO dijo que planea lanzar un nivel GPT4 Abierto…

– Teknium (e/λ) (@Teknium1) 1 de enero de 2024

¿Abierto o cerrado? Un debate interminable

El debate entre código abierto y código cerrado recuerda a las primeras batallas de sistemas operativos entre Windows y Linux. Santiago Pino, de ML School, escribió que los modelos de IA propietarios pueden ganarse a los consumidores en general como hizo Windows, pero que el software de código abierto ofrece una personalización y un control que pueden ser extremadamente útiles para los usuarios corporativos.

Pino destacó cómo muchas empresas empiezan a experimentar con ChatGPT, pero luego migran a modelos de código abierto, que pueden ajustar y personalizar según sus necesidades específicas y los requisitos de cumplimiento de datos. Las soluciones de código abierto evitan la dependencia de un proveedor y ofrecen transparencia.

«Los modelos cerrados y propietarios pueden convencer a los particulares, pero la mayoría de las empresas no quieren enviar sus datos a Microsoft o Google. Quieren el control. Los modelos de código abierto son la respuesta», afirmó en un tuit días antes de que el hilo de Bernard se hiciera viral.

Los modelos de código abierto destruirán ChatGPT y Gemini.

La historia de los modelos de código abierto es la historia de Linux. Windows y Mac ganaron consumidores, pero Linux se convirtió en el sistema operativo de Internet.

Lo mismo ocurrirá con ChatGPT, Gemini y los modelos de código abierto. Cerrado,… pic.twitter.com/fdmS1VNtqf

– Santiago (@svpino) 22 de diciembre de 2023

Este tipo de opinión fue compartida en el debate sobre el tuit de Bernard por Sciumo Inc, una empresa de desarrollo de software, que hizo hincapié en el potencial de nicho de los modelos de código abierto: «(Los modelos de código abierto) competirán donde importa: problemas específicos del dominio con datos y conocimientos específicos del dominio que (OpenAI) no tiene».

Furkan Gözükara, ingeniero informático conocido por su canal de YouTube SECourses, también se encuentra entre los que tienen una postura más matizada. Hablando con TCN, se mostró de acuerdo con Bernard, diciendo que «sólo en tareas específicas los LLM de código abierto superarán a OpenAI».

Gözükara pone el ejemplo de una empresa que «forma LLM en (sus) propios documentos». Sí, OpenAI tiene la capacidad de personalizar GPTs basados en instrucciones y documentos específicos, pero el manejo de datos sensibles a terceros es siempre una preocupación. Esa preocupación se confirmó recientemente cuando se reveló que los GPT personalizados cedían datos sensibles a terceros usuarios.

Yan Lecun, jefe de desarrollo de IA de Meta y acérrimo defensor del código abierto, ha declarado en repetidas ocasiones que «los modelos de base de IA de código abierto acabarán con los modelos de IA cerrados y propietarios». Google, otro gigante de la IA, también reconoce la amenaza que supone la IA de código abierto: «Los modelos de código abierto son más rápidos, más personalizables, más privados y, libra por libra, más capaces», decía un memorando de Google filtrado en 2023.

Queda por ver si los modelos de código abierto igualarán o superarán a la GPT-4 y futuras iteraciones este año. Sin embargo, las perspectivas de los expertos de ambos bandos revelan una intrigante tensión. Los modelos de código cerrado pueden tener ventaja en recursos e iteración rápida, pero las herramientas de código abierto evolucionan con rapidez y ofrecen capacidades permanentes y personalizables. Por ahora, la comunidad de la IA puede ver cómo se desarrolla la competición y disfrutar de las ventajas de utilizar la mejor tecnología disponible.

Código abierto u OpenAI: ¿cuál es el mejor camino hacia la IA avanzada?

¿Abierto o cerrado? Un debate interminable

La startup francesa Deskoin lanza una aplicación móvil para democratizar la inversión en criptomonedas

Los usuarios de Solana DeFi ya pueden esperar el lanzamiento de Jupiter JUP

Related Posts

Leave a Comment Cancel Reply