Home » Le nouveau générateur d’images DALL-E 3 est une grande amélioration – avec des garde-fous

Le nouveau générateur d’images DALL-E 3 est une grande amélioration – avec des garde-fous

by Thomas

OpenAI, la licorne à l’origine du boom de l’industrie de l’IA générative, a dévoilé DALL-E 3, la dernière itération de son générateur d’images. Grâce à son contrôleur ChatGPT, la mise à jour fournit des images de qualité supérieure en réponse à des invites en langage naturel, et se lance avec des contrôles éthiques en place.

Les générateurs d’images tels que DALL-E, MidJourney et Stable Diffusion ont ouvert de nouvelles frontières créatives pour les artistes et les utilisateurs occasionnels depuis le boom de l’IA à la fin de l’année dernière. En traduisant des messages textuels en images étonnantes, ils offrent un aperçu de l’interprétation de la créativité humaine par la machine. Aujourd’hui, OpenAI entend repousser encore les limites avec DALL-E 3, un modèle qui pourrait la remettre en concurrence directe avec d’autres leaders du secteur.

Dévoilé aujourd’hui, DALL-E 3 présente des améliorations considérables dans la représentation précise de descriptions textuelles détaillées. Contrairement aux versions précédentes, il respecte scrupuleusement les messages complexes sans nécessiter d’importantes modifications de l’ingénierie des messages ou d’autres astuces compliquées. Le nouveau système excelle également dans la capture des relations entre les objets et la génération de détails humains photoréalistes tels que les mains et les reflets.

Lorsque l’on compare les sorties des mêmes invites dans DALL-E 2 et DALL-E 3, ce dernier produit des images nettement plus nettes et plus précises. Il est capable de restituer des scènes extrêmement réalistes tout en obtenant des textures, des éclairages et des arrière-plans corrects. Il semble également capable de générer du texte et de l’intégrer dans ses images, ce qui reste un problème pour les générateurs d’images les plus puissants à ce jour.

DALL-E 3 s’appuie sur ChatGPT, qui permet aux utilisateurs d’affiner les messages de manière itérative par le biais d’échanges conversationnels. Les premières fuites laissent entrevoir des capacités d’itération extrêmement rapides. Comme TCN l’a précédemment rapporté, le YouTubeur MattVidPro a qualifié une première version bêta de DALL-E 3 de « folle » et a affirmé que même la version à venir de MidJourney ne pourrait pas rivaliser.

Cependant, la disponibilité reste étroitement limitée à environ 400 testeurs et OpenAI affirme que son nouveau modèle sortira « bientôt ». « 

Une image créée avec DALL-E 3 et le langage d'incitation utilisé au cours du processus. Source : OpenAI

Une image créée avec DALL-E 3 et le langage d’incitation utilisé au cours du processus. Source : OpenAI


Pour l’instant, les utilisateurs peuvent créer des images avec DALL-E 2 en utilisant des plugins avec ChatGPT Plus. Ceux qui ne paient pas d’abonnement devront faire face à des restrictions telles que celles-ci :


Le chemin parcouru jusqu’ici n’a pas été sans heurts. Pendant sa phase de test bêta, le modèle a été remarqué pour sa nature non censurée, capable de générer du contenu allant de la nudité au gore et à la violence. Cela a fait froncer les sourcils et suscité des inquiétudes quant à l’utilisation potentiellement abusive d’une telle technologie. Mais OpenAI semble avoir pris ces préoccupations à cœur, en mettant en œuvre dans DALL-E 3 des fonctions qui empêchent la génération de contenus pouvant être considérés comme violents, adultes ou haineux, garantissant ainsi une expérience utilisateur plus sûre.

L’une de ces mesures est la constitution d’une équipe d’experts « pour nous aider à évaluer les risques et à atténuer nos efforts dans des domaines tels que la propagande et la désinformation ».

Les inquiétudes concernant l’art de l’IA persistent, notamment en ce qui concerne les contenus inappropriés ou contraires à l’éthique. Bien qu’OpenAI ait supprimé les filtres lors des tests, l’entreprise étudie des stratégies visant à prévenir les abus dans les versions publiques. Elle facilitera également l’identification des images générées à l’aide de son outil. Cela pourrait empêcher la diffusion de deepfake et potentiellement identifier l’origine d’une image au cas où quelqu’un contournerait la censure native du modèle.

OpenAI est également consciente des préoccupations relatives à l’utilisation légale d’œuvres d’art humaines pour l’entraînement de son modèle et a trouvé une réponse à un générateur plus éthique. DALL-E 3 ne reproduira pas de contenu lorsqu’on lui demandera d’imiter des artistes vivants, et OpenAI permettra aux créateurs d’exercer leur droit de retrait. Cette mesure répond aux réactions d’artistes tels que Greg Rutkowski, qui estiment qu’il est contraire à l’éthique que l’IA copie leur style sans leur consentement.

D’importantes actions en justice ont également été intentées, notamment par l’auteur George R.R. Martin, qui accuse OpenAI d’utiliser de manière inappropriée du matériel protégé par des droits d’auteur.

OpenAI n’a pas répondu immédiatement à une demande de commentaires de TCN.

Related Posts

Leave a Comment