OpenAI a testé en privé une nouvelle itération de son modèle d’imagerie générative d’intelligence artificielle (IA) au cours des derniers mois, et les premiers échantillons divulgués par le YouTubeur MattVidPro montrent qu’il est plus performant que les précédents générateurs d’images.
« C’est extrêmement excitant, cela explose tout ce que nous avons vu auparavant, c’est fou », a déclaré Matt dans un aperçu qu’il a posté sur YouTube. « Midjourney ne peut pas rivaliser à ce niveau – je ne pense même pas que la version 6 de Midjourney serait capable de rivaliser à ce niveau.
N’espérez pas l’essayer de sitôt, cependant. L’accès est extrêmement limité.
Le modèle non publié est probablement une mise à jour de DALL-E 2 et est testé en avant-première sur invitation uniquement, dans le cadre de ChatGPT-4. Selon Matt, seules 400 personnes dans le monde ont accès à ce nouveau générateur d’images OpenAI.
Bien que limités, les échantillons d’images démontrent les compétences avancées de l’IA. Elle a produit des images nettes dont l’éclairage et les reflets imitent les photos réelles. Le modèle a recréé des peintures détaillées avec des coups de pinceau visibles. Il a également recréé des noms de marque comme « Snickers » et des logos de marques connues comme Subway sans aucun problème sur les produits générés, et a obtenu une orthographe raisonnablement bonne dans les textes rendus.
Alors que les générateurs d’images actuels peinent à produire des mains cohérentes, les exemples montraient des mains réalistes et correctement proportionnées. Les arrière-plans semblaient également plus convaincants que ceux des systèmes d’IA concurrents.
OpenAI a apparemment supprimé ses filtres de sécurité pour tester le plein potentiel du modèle. Les utilisateurs ont déclaré qu’il pouvait générer des contenus violents et de la nudité sans hésitation. Toutefois, connaissant la position d’OpenAI à l’égard du contenu NSFW, il est très peu probable qu’une version publique officielle soit publiée dans le respect de ces normes.
« C’est OpenAI, donc vous pouvez être sûr qu’ils vont faire attention à ce truc comme ils le font pour tout avant de le publier », a observé Matt.
Certains experts ont critiqué OpenAI pour avoir « simplifié » ses modèles afin d’éviter toute controverse potentielle. Certaines études suggèrent même qu’OpenAI a formé ChatGPT pour qu’il ait un fort penchant politique dans ses résultats.
Néanmoins, la qualité constante des échantillons constitue un progrès. Elle met en évidence les efforts continus d’OpenAI pour améliorer les capacités d’IA générative. L’entreprise pourrait en dire plus sur ses progrès dans le courant de l’année, en particulier si le domaine de la reconnaissance et de la génération d’images contribue à améliorer la robustesse de son produit phare : un GPT-4 multimodal capable de comprendre du texte, des images et des brouillons en une seule fois.
Pour l’instant, la technologie reste confinée à des tests fermés avec un nombre minuscule d’utilisateurs.
À mesure que les modèles s’améliorent, la frontière entre l’artificiel et le réel s’estompe encore davantage. Si cette évolution en enthousiasme plus d’un, les inquiétudes concernant les abus persistent. Construire cette technologie de manière responsable reste un défi urgent.