Home » La nouvelle version V6 de MidJourney améliore les visuels et s’attaque à la génération de texte (en grande partie)

La nouvelle version V6 de MidJourney améliore les visuels et s’attaque à la génération de texte (en grande partie)

by Thomas

MidJourney vient d’annoncer son nouveau modèle de générateur d’images IA, le modèle de base V6, dans la course acharnée pour dominer le royaume de la créativité numérique. Lancé aujourd’hui en alpha test, l’équipe de développement indique que le V6 offre une meilleure précision, une meilleure cohérence et, pour la première fois dans l’évolution de MidJourney, des capacités de génération de texte.

Annoncée dans un message officiel sur Discord, la V6 se présente comme une refonte majeure.

« Le suivi des invites est beaucoup plus précis, les invites sont plus longues, la cohérence et la connaissance du modèle sont améliorées », révèle l’annonce, soulignant les progrès réalisés par rapport au modèle précédent V5.1 lancé en mai 2023. Le modèle V5, réputé pour ses messages courts faciles à utiliser et ses améliorations esthétiques, a ouvert la voie au modèle V6, plus sophistiqué et plus détaillé.

L’un des éléments les plus remarquables de V6 est sa capacité à dessiner du texte. Bien qu’il ne s’agisse pas du point central du modèle – l’équipe affirme qu’il s’agit d’une caractéristique « mineure » – cette capacité place MidJourney en concurrence directe avec d’autres modèles de premier plan tels que Dall-E 3 et Ideogram. Cependant, l’approche de MidJourney en matière de génération de texte est unique.

MidJourney la décrit comme une « capacité mineure de dessin de texte ». « Vous devez écrire votre texte entre guillemets et les valeurs –style raw ou –stylize inférieures peuvent vous aider.

TCN a pu tester le modèle et le comparer à Dall-E 3, connu pour sa précision dans la génération de texte. MidJourney semble privilégier le style et l’esthétique, parfois au détriment de la précision du texte. La plupart du temps, il a généré un texte imprécis ou inexistant. Mais lorsqu’il le faisait, les images étaient équivalentes, voire meilleures, que celles générées par Dall-E 3, le modèle d’IA texte-image qui équipe ChatGPT et Microsoft Bing.


En comparant les générations de textes de MidJourney, Dall-E 3, SDXL avec Harrlogos et Ideogram AI, on pourrait recommander, de manière simplifiée, d’utiliser MidJourney si l’esthétique est une priorité, Dall-E 3 pour la facilité d’utilisation et l’esthétique des dessins animés, SDXL pour ceux qui ont une connaissance avancée de A1111, et Ideogram AI pour les résultats dans lesquels le texte est plus important que l’esthétique.

MidJourney et Dalle-3 avec ChatGPT sont actuellement payants, tandis que SDXL et Ideogram AI sont gratuits. La version Bing de Dall-E 3 est gratuite, mais elle ne génère que des images carrées et les utilisateurs ne peuvent que modifier les messages-guides, au lieu de l’approche de conversation naturelle adoptée par OpenAI.

MidJourney V6 est également un peu plus lent et plus cher que la version 5, mais l’équipe souligne qu’elle s’efforce d’accélérer le modèle au fil du temps. Le modèle V6 dispose également d’un upscaler amélioré dans les modes « subtil » et « créatif », améliorant la résolution de l’image par deux.

Ces fonctionnalités, associées à une gamme variée d’arguments pris en charge tels que –ar (pour modifier la résolution), –chaos (pour modifier les variations entre les générations) et –stylize (pour modifier le degré de créativité du modèle), offrent aux utilisateurs un large éventail de possibilités créatives. Cependant, d’autres fonctions telles que l’inpainting, l’outpainting et la description de l’image ne sont pas encore disponibles. Elles devraient faire l’objet d’une mise à jour le mois prochain, selon MidJourney.

L’annonce appelle les utilisateurs à utiliser ces « pouvoirs incroyables avec joie, émerveillement, responsabilité et respect », ce qui a toujours fait partie de l’éthique de MidJourney. Mais ne vous réjouissez pas trop vite, car la censure sera plus stricte.

« Ne soyez pas un imbécile et ne créez pas d’images pour provoquer un drame », peut-on lire dans l’annonce. Il y a fort à parier que cela bloque les tentatives de création de waifus numériques ou de deepfakes politiques.

Related Posts

Leave a Comment