Ideogram, un générateur d’images AI créé par d’anciens ingénieurs de Google, a publié sa première série de mises à jour destinées à rendre la plateforme plus fonctionnelle et utilisable. Les mises à jour ajoutent des capacités pour mieux correspondre aux offres de Stable Diffusion et Midjourney à un prix attractif.
La première version publique d’Ideogram en février a rapidement gagné en popularité parmi les passionnés d’IA en tant qu’alternative solide et performante à Midjourney, Dall-E 3 et Stable Diffusion. Les tests effectués par TCN ont révélé que le logiciel excellait en termes de compréhension rapide, de capacités de génération de texte, de conscience spatiale, d’adhésion rapide, de variété de styles, de génération de personnes et de marques, et de qualité globale par rapport à d’autres générateurs d’images populaires.
« Nous sommes ravis de publier une mise à jour majeure d’Ideogram 1.0, notre modèle texte-image le plus avancé, ainsi que plusieurs nouvelles fonctionnalités, notamment ‘décrire’ pour la légende de l’image, l’invite négative, et le contrôle de la qualité et de la vitesse du rendu de l’image », peut-on lire dans l’annonce officielle.
La « description » analyse une image et aide à la légender ; l' »invite négative » indique au modèle les éléments à éviter de générer, et les contrôles de la vitesse et du rendu de l’image équilibrent la qualité de la sortie avec l’efficacité pour ceux qui préfèrent les générations rapides aux générations détaillées. Cette dernière caractéristique imite les modèles Turbo et LCM de Stable Difussion.
Ces mises à jour sont toutefois assorties d’un inconvénient : elles ne sont disponibles que pour les clients payants. Les utilisateurs gratuits auront accès au modèle mais seront limités à la génération de 25 lots de 4 images chacun.
Les personnes désireuses d’essayer ces fonctionnalités peuvent passer à l’option « Basic » pour 7 $ par mois ou à l’option « Plus » pour 16 $. Les plans payants permettent également aux utilisateurs d’accéder à d’autres avantages tels que les générations privées, le contrôle des semences, les capacités d’inpainting et les générations illimitées en mode lent.
La fonction « décrire » est un ajout important, en particulier pour les utilisateurs de base. Cet assistant fournit des descriptions détaillées de toute image téléchargée, qui peuvent ensuite être utilisées pour générer des invites plus précises ou plus descriptives afin de mieux correspondre à la référence lors des itérations suivantes. Les utilisateurs peuvent demander des descriptions pour n’importe quelle image du flux Ideogram ou pour leurs propres images téléchargées à partir d’un appareil local.
Ideogram permet désormais aux utilisateurs de choisir entre trois options de rendu : rapide, par défaut et de qualité. Le mode rapide privilégie la vitesse et génère des images en cinq secondes environ, tandis que le mode qualité privilégie les détails les plus fins et génère des images en 20 secondes environ.
La fonction d’invite négative, quant à elle, étend les capacités d’édition d’Ideogram. Cet outil permet aux utilisateurs de spécifier ce qu’ils ne veulent pas voir dans les images générées, offrant ainsi un meilleur contrôle sur le résultat. Cette fonction est particulièrement utile pour affiner les résultats de la génération de texte à partir d’images, ce qui permet d’obtenir des images plus précises et plus pertinentes du premier coup.
Enfin, Ideogram affirme avoir amélioré le rendu du texte et le photoréalisme. L’équipe affirme que la mise à niveau réduit les taux d’erreurs de texte de 15 % supplémentaires par rapport au modèle original. Ideogram affirme que les évaluateurs ont préféré les images générées par le modèle mis à jour de 30 à 50 % de plus que celles de la version initiale.
L’équipe d’Ideogram a d’abord annoncé ces améliorations le mois dernier lors d’une session Discord, qui a suscité un engouement positif au sein de sa communauté d’utilisateurs.
Grâce à ces améliorations et aux tarifs mensuels de 7 à 16 dollars, Ideogram est un concurrent solide et rentable pour un outil d’IA générateur d’images. À titre de comparaison, un abonnement à MidJourney coûte entre 96 et 1152 dollars par an, un abonnement à ChatGPT Plus – qui donne accès à Dall-E 3- coûte 20 dollars par mois, et d’autres générateurs d’images d’IA comme Leonardo AI et Maze Guru ont des niveaux d’abonnement compris entre 10 et 25 dollars.
Pour ceux qui ne sont pas prêts à payer pour des fonctionnalités premium, Stable Diffusion est gratuit et offre des fonctionnalités similaires, du moins pour les utilisateurs disposant d’ordinateurs plus puissants.