Home » Neue MidJourney V6 Version verbessert die Optik und geht die Texterstellung an (größtenteils)

Neue MidJourney V6 Version verbessert die Optik und geht die Texterstellung an (größtenteils)

by Thomas

MidJourney hat soeben sein neuestes KI-Bildgeneratormodell, das V6-Basismodell, im engen Rennen um die Vorherrschaft im Bereich der digitalen Kreativität angekündigt. Das Entwicklerteam sagt, dass V6 eine verbesserte Genauigkeit der Eingabeaufforderung, eine verbesserte Kohärenz und – zum ersten Mal in der Entwicklung von MidJourney – die Möglichkeit der Texterstellung bietet.

Angekündigt in einem offiziellen Discord-Post, wird V6 als eine große Überarbeitung dargestellt.

„Viel genaueres Verfolgen von Prompts sowie längere Prompts, verbesserte Kohärenz und Modellwissen“, verrät die Ankündigung und hebt die Fortschritte gegenüber dem Vorgängermodell V5.1 hervor, das im Mai 2023 eingeführt wurde. Das Modell V5, das für seine benutzerfreundlichen Kurzansagen und seine ästhetischen Verbesserungen bekannt war, ebnete den Weg für das anspruchsvollere und detailliertere Modell V6.


Eine der bemerkenswertesten Komponenten von V6 ist seine Fähigkeit, Text zu zeichnen. Obwohl es nicht der Schwerpunkt des Modells ist – das Team sagt, es sei immer noch ein „kleines“ Feature – stellt diese Fähigkeit MidJourney in direkten Wettbewerb mit anderen führenden Modellen wie Dall-E 3 und Ideogram. MidJourne’s Ansatz zur Texterstellung ist jedoch einzigartig.

Midjourney beschreibt es als „kleine Textzeichenfunktion“. „Sie müssen Ihren Text in ‚Anführungszeichen‘ schreiben und –style raw oder niedrigere –stylize-Werte können dabei helfen.“

TCN war in der Lage, das Modell zu testen und es mit Dall-E 3 zu vergleichen, das für seine Genauigkeit bei der Texterstellung bekannt ist. MidJourney scheint Stil und Ästhetik zu bevorzugen, manchmal auf Kosten der Textgenauigkeit. Die meiste Zeit erzeugte es entweder ungenauen oder gar keinen Text. Aber wenn doch, dann waren die Bilder gleichwertig oder sogar besser als die von Dall-E 3, dem Text-Bild-KI-Modell, das ChatGPT und Microsoft Bing antreibt.

Vergleicht man die Texterzeugungen von MidJourney, Dall-E 3, SDXL mit Harrlogos und Ideogram AI, könnte eine vereinfachte Empfehlung lauten, MidJourney zu verwenden, wenn die Ästhetik im Vordergrund steht, Dall-E 3 für einfache Bedienung und Cartoon-Digitalkunst-Ästhetik, SDXL für diejenigen mit fortgeschrittenen Kenntnissen von A1111 und Ideogram AI für Ergebnisse, bei denen der Text wichtiger ist als die Ästhetik.

MidJourney und Dalle-3 mit ChatGPT kosten derzeit Geld, während SDXL und Ideogram AI kostenlos sind. Bing’s Version von Dall-E 3 ist kostenlos, aber sie erzeugt nur quadratische Bilder und die Benutzer können nur die Prompts ändern, anstatt den natürlichen Konversationsansatz von OpenAI.

MidJourney V6 ist auch ein wenig langsamer und teurer als v5, aber das Team betont, dass es sich darauf konzentriert, das Modell mit der Zeit zu beschleunigen. Das V6-Modell verfügt außerdem über verbesserte Upscaler in den Modi ‚Subtil‘ und ‚Kreativ‘, die die Bildauflösung um das Doppelte erhöhen.

Diese Funktionen in Verbindung mit einer Vielzahl von unterstützten Argumenten wie –ar (zum Ändern der Auflösung), –chaos (zum Ändern der Variationen zwischen den Generationen) und –stylize (zum Ändern, wie kreativ das Modell ist) bieten den Benutzern ein breites Spektrum an kreativen Möglichkeiten. Andere Funktionen wie Inpainting, Outpainting und Bildbeschreibung sind jedoch noch nicht verfügbar. Sie sollen laut MidJourney mit einem Update im nächsten Monat kommen.

Die Ankündigung ruft die Nutzer dazu auf, diese „unglaublichen Kräfte mit Freude, Staunen, Verantwortung und Respekt“ zu nutzen, was schon immer Teil von MidJournys Ethos gewesen ist. Aber freuen Sie sich nicht zu sehr, denn sie werden strenger mit der Zensur sein.

„Sei kein Idiot und erstelle keine Bilder, die ein Drama verursachen“, heißt es in der Ankündigung. Die Chancen stehen gut, dass damit Versuche, digitale Waifus oder politische Deepfakes zu erstellen, blockiert werden

Related Posts

Leave a Comment