Home » El nuevo generador de imágenes DALL-E 3 es una gran actualización, con guardarraíles

El nuevo generador de imágenes DALL-E 3 es una gran actualización, con guardarraíles

by v

OpenAI, el unicornio que está detrás del auge del sector de la IA generativa, ha presentado DALL-E 3, la última iteración de su generador de imágenes. Con su controlador ChatGPT, la actualización proporciona imágenes de la máxima calidad en respuesta a indicaciones en lenguaje natural, y se lanza con controles éticos.

Los generadores de imágenes como DALL-E, MidJourney y Stable Diffusion han abierto nuevas fronteras creativas para artistas y usuarios ocasionales desde el boom de la IA a finales del año pasado. Al traducir las instrucciones de texto en asombrosos efectos visuales, ofrecen atisbos de interpretaciones automáticas de la creatividad humana. Ahora, OpenAI pretende ampliar aún más los límites con DALL-E 3, un modelo que podría volver a situarla en competencia directa con otros líderes del sector.

Presentado a primera hora de hoy, DALL-E 3 muestra enormes mejoras en la representación precisa de descripciones textuales detalladas. A diferencia de las versiones anteriores, se adhiere perfectamente a las indicaciones complejas sin necesidad de realizar grandes ajustes de ingeniería u otros complicados trucos. El nuevo sistema también destaca en la captura de relaciones entre objetos y la generación de detalles humanos fotorrealistas, como manos y reflejos.

Cuando se comparan las salidas de las mismas indicaciones en DALL-E 2 y DALL-E 3, este último produce imágenes notablemente más nítidas y precisas. Es capaz de representar escenas con gran realismo, con texturas, iluminación y fondos correctos. Y parece bastante capaz de generar texto e integrarlo en sus imágenes, algo que sigue siendo un problema incluso para los generadores de imágenes de IA más potentes hasta la fecha.

DALL-E 3 se basa en ChatGPT, lo que permite a los usuarios perfeccionar las instrucciones a través de intercambios conversacionales. Las primeras muestras filtradas apuntan a una capacidad de iteración rapidísima. Como ya informó TCN, el YouTuber MattVidPro calificó una beta anterior de DALL-E 3 de «locura» y afirmó que ni siquiera la próxima versión de MidJourney podría competir con ella.

Sin embargo, la disponibilidad sigue limitada a unos 400 probadores y OpenAI afirma que su nuevo modelo saldrá a la venta «pronto».

Una imagen creada con DALL-E 3 y el lenguaje utilizado en el proceso. Fuente: OpenAI

Una imagen creada con DALL-E 3 y el lenguaje utilizado en el proceso. Fuente: OpenAI


Por ahora, los usuarios pueden crear imágenes con DALL-E 2 utilizando plugins con ChatGPT Plus. Los que no paguen una suscripción tendrán que enfrentarse a restricciones como ésta:


El camino hasta aquí no ha estado exento de baches. Durante su fase de pruebas beta, el modelo destacó por su naturaleza sin censura, capaz de generar contenidos que iban desde la desnudez hasta el gore y la violencia. Esto levantó ampollas y despertó inquietudes sobre el posible uso indebido de dicha tecnología. Pero OpenAI parece haberse tomado muy en serio estas preocupaciones, implementando características en DALL-E 3 que impiden la generación de contenidos que puedan considerarse violentos, para adultos o que inciten al odio, garantizando una experiencia de usuario más segura.

Una de esas medidas es la reunión de un equipo de expertos «para ayudar a informar nuestra evaluación de riesgos y esfuerzos de mitigación en áreas como la propaganda y la desinformación».

Las preocupaciones en torno al arte de la IA persisten, especialmente en lo que se refiere a contenidos inapropiados o poco éticos. Aunque OpenAI eliminó los filtros durante las pruebas, la empresa está explorando estrategias para evitar el uso indebido en las versiones públicas. También facilitará la identificación de imágenes generadas con su herramienta. Esto podría evitar la propagación de deepfakes e identificar potencialmente el origen de una imagen en caso de que alguien se salte la censura nativa del modelo.

OpenAI también es consciente de la preocupación que suscita el uso legal de obras de arte humanas para entrenar a su modelo y ha dado una respuesta a un generador más ético. DALL-E 3 no reproducirá contenidos cuando se le pida que imite a artistas vivos, y OpenAI permitirá a los creadores optar por no hacerlo. Esto responde a la reacción de artistas como Greg Rutkowski, que argumentan que la IA que copia su estilo sin consentimiento no es ética.

También se han presentado importantes demandas, entre ellas la del escritor George R.R. Martin, que acusa a OpenAI de uso indebido de material protegido por derechos de autor.

OpenAI no respondió de inmediato a la solicitud de comentarios de TCN.

Related Posts

Leave a Comment