Home » La nuova versione di MidJourney V6 migliora la grafica e affronta la generazione di testo (soprattutto)

La nuova versione di MidJourney V6 migliora la grafica e affronta la generazione di testo (soprattutto)

by Patricia

MidJourney ha appena annunciato il suo nuovo modello di generatore di immagini AI, il modello base V6, nell’affollata gara per dominare il regno della creatività digitale. In fase di test alfa da oggi, il team di sviluppo afferma che il modello V6 è caratterizzato da una maggiore accuratezza della richiesta, da una migliore coerenza e, per la prima volta nell’evoluzione di MidJourney, dalla capacità di generare testo.

Annunciata in un post ufficiale su Discord, la V6 si presenta come un’importante revisione.

“Seguire i prompt in modo molto più accurato, oltre a prompt più lunghi, coerenza migliorata e conoscenza del modello”, rivela l’annuncio, sottolineando i suoi progressi rispetto al precedente modello V5.1, lanciato nel maggio 2023. Il modello V5, noto per i suoi prompt brevi e facili da usare e per il miglioramento dell’estetica, ha aperto la strada al più sofisticato e dettagliato V6.


Una delle componenti più degne di nota di V6 è la sua capacità di disegnare testi. Pur non essendo il punto focale del modello – il team afferma che si tratta di una caratteristica “minore” – questa capacità mette MidJourney in diretta competizione con altri modelli leader come Dall-E 3 e Ideogram. Tuttavia, l’approccio di MidJourney alla generazione del testo è unico.

Midjourney la descrive come una “capacità minore di disegno del testo”. “È necessario scrivere il testo in ‘virgolette’ e i valori –style raw o lower –stylize possono aiutare”.

TCN ha potuto testare il modello e confrontarlo con Dall-E 3, noto per la sua precisione nella generazione del testo. MidJourney sembra privilegiare lo stile e l’estetica, a volte a scapito della precisione del testo. Per la maggior parte del tempo ha generato un testo impreciso o nullo. Ma quando lo faceva, le immagini erano alla pari o addirittura migliori di quelle generate da Dall-E 3, il modello di intelligenza artificiale da testo a immagine che alimenta ChatGPT e Microsoft Bing.


Confrontando le generazioni di testo di MidJourney, Dall-E 3, SDXL con Harrlogos e Ideogram AI, una raccomandazione troppo semplice potrebbe essere quella di usare MidJourney se l’estetica è una priorità, Dall-E 3 per la facilità d’uso e l’estetica dell’arte digitale dei cartoni animati, SDXL per coloro che hanno una conoscenza avanzata dell’A1111 e Ideogram AI per risultati in cui il testo è più importante dell’estetica.

MidJourney e Dalle-3 con ChatGPT hanno attualmente un costo, mentre SDXL e Ideogram AI sono gratuiti. La versione di Dall-E 3 di Bing è gratuita, ma genera solo immagini quadrate e le persone possono modificare solo le richieste, invece dell’approccio di conversazione naturale adottato da OpenAI.

MidJourney V6 è anche un po’ più lento e più costoso della versione 5, ma il team sottolinea la sua attenzione a velocizzare il modello nel tempo. Il modello V6 vanta anche un upscaler migliorato nelle modalità “sottile” e “creativa”, che aumenta la risoluzione delle immagini di due volte.

Queste caratteristiche, insieme a una vasta gamma di argomenti supportati come –ar (per cambiare la risoluzione), –chaos (per cambiare le variazioni tra le generazioni) e –stylize (per cambiare la creatività del modello), offrono agli utenti un ampio spettro di possibilità creative. Tuttavia, altre funzioni come l’inpainting, l’outpainting e la descrizione dell’immagine non sono ancora disponibili. Secondo MidJourney, dovrebbero arrivare con un aggiornamento il mese prossimo.

L’annuncio invita gli utenti a utilizzare questi “incredibili poteri con gioia, meraviglia, responsabilità e rispetto”, che è sempre stato parte dell’etica di MidJourney. Ma non esaltatevi troppo, perché la censura sarà più severa.

“Non essere un idiota o creare immagini per causare drammi”, si legge nell’annuncio. È probabile che questo blocchi i tentativi di creare waifu digitali o deepfake politici.

Related Posts

Leave a Comment