Midjourney V7 wurde am 4. April 2025 veröffentlicht und brachte zwei wesentliche Neuerungen mit sich, die die Art und Weise, wie Nutzer mit der Plattform interagieren, sofort veränderten. Jeder Nutzer muss nun ein obligatorisches Personalisierungs-Setup absolvieren , 200 Bildpaare bewerten , , bevor er etwas generieren kann. Der Draft-Modus liefert unterdessen zehnmal schnellere Ergebnisse bei halbem GPU-Verbrauch und macht schnelles Ideenausprobieren wirklich erschwinglich. Das Update verbessert außerdem Texturen, Porträtrealismus und die Verarbeitung komplexer Prompts. Es gibt noch erheblich mehr Wissenswertes darüber, was V7 in der Praxis tatsächlich verändert.
Inhaltsverzeichnis
ToggleWas ist Midjourney V7 und wann wurde es eingeführt?

Midjourney V7 ist die siebte Hauptversion des KI-Bildgenerierungsmodells des Unternehmens und stellt nach allgemeiner Einschätzung einen bedeutenden Fortschritt dar. Es basiert auf einer multimodalen parallelen Diffusions-Konverter-KI-Architektur mit 12 Milliarden Parametern und ist die leistungsfähigste Version, die das Unternehmen bisher veröffentlicht hat. Man kann sich diese Parameter als das angesammelte Wissen des Modells vorstellen , mehr bedeutet im Allgemeinen klüger.
Die Alpha-Version wurde am 4. April 2025 veröffentlicht, nachdem frühere Prognosen zunächst den Februar als Zieldatum gesetzt hatten, bevor technische Verzögerungen dazwischenkamen. Geduld war offenbar gefragt. V7 folgte auf V6.1, das seit Juli 2024 still und zuverlässig seinen Dienst getan hatte. Ein bemerkenswerter Fortschritt ist die mehrsprachige Verarbeitung, was bedeutet, dass Nutzer weltweit nun in ihrer Muttersprache prompten können und dabei deutlich bessere Ergebnisse erzielen , ein stilles, aber wirklich befreiendes Upgrade für Nicht-Englischsprachige.
Was ist erzwungene Personalisierung in V7 und warum ist sie obligatorisch?
Vielleicht das meistdiskutierte Merkmal von V7 ist seine obligatorische Personalisierungsanforderung , eine Funktion, die gleichzeitig als Zugangshürde fungiert. Anders als frühere Versionen verarbeitet V7 keinen einzigen Prompt, bis die Personalisierung freigeschaltet ist. Das hat merklichen Widerstand bei Nutzern ausgelöst, besonders bei jenen, die einfach Bilder generieren möchten, ohne erst durch Reifen springen zu müssen.
Der Freischaltprozess erfordert:
- Das Bewerten von mindestens 200 Bildpaaren auf der Personalisierungsseite
- Das Auswählen eines globalen V7-Profils, bevor Bewertungen zum Fortschritt zählen
- Das Abschließen des Prozesses in etwa fünf Minuten, sofern man konzentriert vorgeht
Die Herausforderungen beim Bewerten sind real , 200 Vergleiche fühlen sich wie viel an, bevor man überhaupt etwas generieren kann. Dennoch stellt Midjourney die Reibung als lohnenswert dar und argumentiert, dass das System individuelle ästhetische Vorlieben erlernt und letztendlich genauere, persönlich zugeschnittene Ergebnisse liefert.
Wie man sein Midjourney V7 Personalisierungsprofil aufbaut

Sobald der obligatorische Ranking-Gauntlet abgeschlossen ist, ist das Erstellen eines Personalisierungsprofils in V7 relativ unkompliziert. Das Bild-Ranking bildet die Grundlage , Benutzer sortieren 200 Bildpaare mithilfe von Tastaturkürzeln (‘1’ für links, ‘2’ für rechts) und schließen den Vorgang in wenigen Minuten ab.
| Aktion | Detail |
|---|---|
| Bild-Ranking | Mindestens 200 Paare erforderlich |
| Tastaturkürzel | ‘1’ links, ‘2’ rechts |
| Profil umbenennen | Nach dem Ranking auf den Namen klicken |
| Profilaktivierung | P‑Taste leuchtet rot, wenn aktiv |
Nach dem Ranking ermöglicht die Profilumbenennung den Benutzern, Ästhetiken klar zu kennzeichnen , zum Beispiel „Hyper-Realismus” oder „Linienzeichnung”. Mehrere Profile können gleichzeitig existieren, wobei jedes auf einen bestimmten Stil abzielt. Die Profilaktivierung erfolgt über die P‑Taste neben der Eingabeaufforderungsleiste. Das globale Profil bleibt die Standardeinstellung und wird stillschweigend durch gelikte Bilder auf der Entdecken-Seite geprägt.
Entwurfsmodus in Midjourney V7: 10-mal schneller bei halbem Preis
Der Draft-Modus in Midjourney V7 ist nach jedem Maßstab eine bedeutende technische Leistung , er generiert Bilder zehnmal schneller als das Standard-Rendering und läuft dabei bei halbem GPU-Aufwand, was die Art von Effizienz ist, die Buchhalter unerwartet fröhlich stimmt. Der Kompromiss ist erwartungsgemäß die Bildqualität; der Draft-Modus erzeugt Ausgaben mit geringerer Auflösung, die eher als getreue Vorschauen denn als fertige Werke fungieren, was ihn am besten für schnelles Ideentesten statt für die endgültige Lieferung geeignet macht. Man kann ihn als das Skizzenbuch des Künstlers betrachten , grob, schnell und genau das ist der Sinn der Sache , wobei die Nutzer erwartungsgemäß bevorzugte Ergebnisse auf volle Qualität hochskalieren, sobald eine Richtung bestätigt ist.
Entwurfsmodus-Geschwindigkeitsgewinne
Wenn Geschwindigkeit zählt, liefert der Midjourney V7 Draft Mode sie im Überfluss , er generiert Bilder ungefähr zehnmal schneller als das Standard-Rendering und verbraucht dabei nur die Hälfte der GPU-Ressourcen. Für Kreative, die kreative Freiheit schätzen, stellen diese Geschwindigkeitswerte eine echte Verschiebung dar, wie Ideen erkundet werden können.
Die Effizienzgewinne beim Rendering machen schnelles Experimentieren wirklich praktikabel:
- 10-mal schnellere Generierung im Vergleich zum Standard-Rendering
- 50 % Reduzierung der GPU-Kosten, wodurch Ressourcen weiter gestreckt werden
- Erzeugt vier Bilder pro Prompt, was der Ausgabe eines Standard-Jobs entspricht
Stellen Sie es sich vor wie den Tausch eines Sportwagens gegen einen Jet , ohne Jetpreise zu zahlen. Kreative können ihren Workflow nun schnell mit visuellen Ideen fluten und die volle Rendering-Leistung für Entwürfe reservieren, die es wert sind, zu polierten, hochwertigen Finalversionen weiterentwickelt zu werden.
Kostenersparnis-Aufschlüsselung
Geschwindigkeitsgewinne sind aufregend, aber die eigentliche Geschichte hinter dem Draft-Modus ist, was er mit dem Budget macht. Mit der Hälfte der Standard-GPU-Kosten verändert der Draft-Modus die wirtschaftlichen Auswirkungen kreativer Erkundung grundlegend. Teams können weit mehr Konzepte generieren , Kompositionen, Stimmungen, Richtungen , bevor sie ernsthafte Ressourcen in irgendetwas investieren.
Die Kostenlogik des Arbeitsablaufs ist erfrischend unkompliziert: frei entwerfen, selektiv weitermachen. Nur die Bilder, die es wert sind, verfolgt zu werden, erhalten die vollständige GPU-Behandlung über die Enhance-Schaltfläche. Alles andere kostet den halben Preis. Das ist kein geringer Rabatt , es ist eine strukturelle Verschiebung in der Art und Weise, wie Experimente finanziert werden.
Praktisch gesehen können Nutzer pro GPU-Einheit etwa zehnmal mehr Iterationen durchführen. Für Agenturen, die Moodboards und Kampagnenkonzepte in großer Menge produzieren, verändert diese Rechnung alles.
Qualität versus Iteration
Der Kompromiss im Mittelpunkt des Entwurfsmodus ist elegant einfach: Auflösung opfern, Geschwindigkeit gewinnen. Der Auflösungskompromiss ist bewusst gewählt , Ausgaben geringerer Qualität dienen der Untersuchung, nicht der Präsentation. Schließlich rahmt niemand eine Skizze auf einer Serviette ein.
Die Einschränkungen des Entwurfsmodus sind real, aber zweckmäßig:
- Typografie und starre Layouts werden hier nicht glänzen , der Entwurfsmodus ist nicht für Präzisionsarbeit gedacht
- Abschlusskampagnen oder polierte Kundenmaterialien erfordern nach wie vor eine Standardgenerierung
- Verbesserungsaktionen existieren genau dazu, würdige Entwürfe auf vollauflösende Ausgaben anzuheben
Was der Entwurfsmodus grundlegend neu definiert, ist die kreative Freiheit. Nutzer können frei generieren, aggressiv iterieren und Ressourcen nur dann einsetzen, wenn etwas dies wirklich verdient. Die Workflow-Logik ist erfrischend ehrlich: weit erkunden, selektiv bestätigen. Qualität bleibt verfügbar , sie kostet nur keine kreative Dynamik mehr, um sie zu erreichen.
Wie der Entwurfsmodus konversationelle Eingabeaufforderungen und Spracheingabe freischaltet
Das Aktivieren des Entwurfsmodus in Midjourney V7 beschleunigt nicht nur den Prozess , es schaltet ein konversationelles Eingabesystem frei, das es Benutzern ermöglicht, Bilder durch natürliche Folgeanweisungen zu verfeinern, anstatt Eingabeaufforderungen von Grund auf neu zu schreiben. Stellen Sie es sich vor wie ein kreatives Gespräch mit der KI: Beginnen Sie mit „eine Katze, die auf einer belebten Straße in Mumbai sitzt”, und lenken Sie es dann mit „mach das cinematischer” , ganz ohne technische Umschreibungen. Für diejenigen, die das Tippen lieber ganz überspringen möchten, unterstützt der Entwurfsmodus auch Spracheingabe, sodass Benutzer ihre Ideen laut aussprechen können, während das System sie in Echtzeit verarbeitet und dabei Bilder generiert und anpasst, während das Gespräch sich entfaltet.
Konversationsbezogene Eingabeaufforderungen erklärt
Sobald der Entwurfsmodus aktiviert ist, erscheint ein kleines Textblasen-Symbol neben ihm , und ein Klick auf dieses Symbol schaltet den Gesprächsmodus frei, der wohl der Punkt ist, an dem sich Midjourney V7 wirklich von seinen Vorgängern zu unterscheiden beginnt.
Anstatt aufwändige technische Prompts zu erstellen, beschreiben Nutzer einfach in natürlicher Sprache, was sie möchten. Midjourney übernimmt die Prompt-Verfeinerung automatisch und wandelt vage Anweisungen in detaillierte kreative Vorgaben um.
Der Arbeitsablauf funktioniert mit erfrischender Einfachheit:
- Nutzer geben ungezwungene Anweisungen ein; Midjourney generiert den vollständigen Prompt
- Unterhalb des Eingabefeldes erscheinen Schlagwortvorschläge zur weiteren Orientierung
- Folgeanweisungen wie „mach es sonniger” ändern frühere Ergebnisse direkt
Das System erinnert sich außerdem an frühere Generierungen und ermöglicht so echte kontextbewusste Iterationen. Kein Auswendiglernen von Syntax. Keine starren Formatierungsregeln. Nur Gespräch , was, ehrlich gesagt, genau so ist, wie kreative Werkzeuge schon längst hätten funktionieren sollen.
Spracheingabefähigkeiten
Der Gesprächsmodus macht das Tippen optional , aber Midjourney V7 geht noch einen Schritt weiter, indem es möglich wird, die Tastatur vollständig wegzulassen. Nach abgeschlossenem Mikrofon-Setup und aktiviertem Entwurfsmodus tippen die Nutzer auf das Mikrofon-Symbol, und eine Wellenform-Anzeige bestätigt, dass das System aktiv zuhört. Natürlich sprechen, aufhören zu reden, und das Modell übernimmt den Rest.
| Spracheingabe-Funktion | Detail |
|---|---|
| Voraussetzung | Entwurfsmodus muss aktiv sein |
| Aktivierung | Mikrofon-Symbol wird orange |
| Feedback-Anzeige | Wellenform-Visualisierung |
| Unterstützte Befehle | Seitenverhältnisse, Stilanweisungen |
| Gerätekompatibilität | Computer und Smartphone |
Parameter, Stilrichtungen, sogar Wiederholungsanfragen , alles per Sprache übermittelbar. In Kombination mit dem 10-fachen Geschwindigkeitsvorteil des Entwurfsmodus wird der Arbeitsablauf wirklich flüssig. Kein Prompt-Engineering. Keine Tastatur. Nur Ideen, laut ausgesprochen, die sich rasch auf dem Bildschirm materialisieren.
Der gestaffelte Arbeitsablauf: In V7 entwerfen, Auswahl treffen, dann verfeinern

Der Entwurfsmodus verändert den kreativen Prozess in Midjourney V7 zu etwas, das einem richtigen redaktionellen Arbeitsablauf ähnelt , der Art, die impulsive erste Entwürfe von durchdachten Endarbeiten trennt. Anstatt GPU-Ressourcen für jede spekulative Idee zu verbrauchen, können Benutzer nun frei erkunden und sich nur auf das festlegen, was seinen Platz verdient.
Der stufenweise Prozess funktioniert so:
- Breit entwerfen , mehrere kostengünstige Kompositionen schnell generieren, unter Verwendung von kollaborativem Feedback und konversationellem Prompting
- Unnachgiebig in die engere Wahl nehmen , iterative Verfeinerung geschieht natürlich; verwerfen, was nicht anspricht, markieren, was es tut
- Selektiv verbessern , auf ausgewählten Entwürfen auf Verbessern klicken, wodurch ‘–draft‘ automatisch entfernt und in voller Qualität neu generiert wird
Es ist eine sinnvolle Trennung von Experimentieren und Ausführen. Der Entwurfsmodus gewährt im Wesentlichen kreative Freiheit ohne die finanzielle Strafe, jede grobe Idee wie ein fertiges Meisterwerk zu behandeln.
Entwurfsmodus vs. Standardmodus: Wann man welchen verwendet
Zu wissen, welchen Modus man wählen soll , und wann , erweist sich als weniger kompliziert, als es klingt. Der Entwurfsmodus eignet sich für Abenteurer , diejenigen, die Konzepte entwickeln, Prompts testen oder schlicht keine GPU-Ressourcen für jeden halbfertigen Gedanken aufwenden wollen. Die Qualitätskompromisse sind real, aber beabsichtigt: geringere Wiedergabetreue im Austausch gegen zehnfach höhere Geschwindigkeit gegenüber dem Standard, bei halben Verarbeitungskosten. Für alle, die umfangreiche Experimente durchführen, summiert sich diese Ressourceneffizienz schnell.
Der Standardmodus hingegen bewährt sich, wenn Präzision gefragt ist , bei endgültigen Renders, die scharfe Texturen, genaue Prompt-Konformität und ausgereifte Kohärenz erfordern. Man kann sich den Entwurfsmodus als Skizzenblock und den Standardmodus als Leinwand vorstellen. Zufriedenstellende Entwurfsergebnisse können jederzeit über die Verbessern-Schaltfläche aufgewertet werden, was bedeutet, dass nichts zwangsläufig verloren geht. Jeder Modus kennt im Wesentlichen seinen Platz.
V7’s technische Upgrades: Bessere Texturen, weniger Artefakte

Wo V6 bereits die Messlatte hoch gelegt hat, übertrifft V7 sie mit einer spürbar reichhaltigeren Bildqualität , präziseren Texturen, schärferen feinen Details und einer deutlichen Reduzierung der visuellen Fehler, die KI-generierte Bilder häufig heimsuchen. Die Texturkomplexität erfährt hier ein echtes Upgrade, wobei professionelle Optionen wie Halbtonpunkte, gerissene Tinte und Holzmaserung nun durch einfaches Prompting erreichbar sind.
Die Verbesserungen bei der Artefakterkennung in V7 sind ebenso bemerkenswert:
- Hände, Augen und Reflexionen werden mit deutlich größerer Kohärenz dargestellt
- SREF-Codes und Style-Weight-Steuerungen (‘–sw‘) ermöglichen es Benutzern, die Texturintensität fein abzustimmen
- Die Niji-7-Variante liefert sauberere Linienführung mit einer flacheren, bewussteren Ästhetik
Das Retexture-Tool erweitert die kreative Freiheit zusätzlich, indem es Oberflächenstile anwendet, ohne die Struktur der ursprünglichen Komposition zu unterbrechen.
Wie Midjourney V7 mit Mehrfachsubjekt- und komplexen Prompts umgeht
Das Verwalten mehrerer Motive in einem einzigen Bild war historisch gesehen eine der hartnäckigsten Schwächen von Midjourney, aber V7 macht durch verbesserte Prompt-Konformität und intelligentere Verarbeitung natürlicher Sprache deutliche Fortschritte. Das Modell reagiert nun zuverlässiger auf strukturierte Ansätze wie die Callback-Technik , bei der Motive konsistente Referenzbezeichnungen erhalten, wie etwa „Charakter A” oder „Charakter B”, und ihre spezifischen Eigenschaften im gesamten Prompt wiederholt werden, um zu verhindern, dass die beiden visuell ineinander verschwimmen. Die Wortreihenfolge spielt hier nach wie vor eine wichtige Rolle, daher verleiht die frühe Platzierung des Hauptmotivs im Prompt ihm eine stärkere kompositorische Priorität , ein kleiner, aber wirklich nützlicher Hebel, wenn es darum geht, komplexe Szenen zu gestalten.
Verbesserungen bei der Handhabung mehrerer Themen
Eines der leise beeindruckenderen Upgrades in Midjourney V7 ist die Art und Weise, wie es mit Bildern mit mehreren Motiven umgeht , etwas, womit frühere Versionen gelegentlich Schwierigkeiten hatten und Kompositionen erzeugten, bei denen Elemente auf ungeschickte Weise um Raum oder Bedeutung konkurrierten. V7 nähert sich diesen Szenen mit einer spürbar stärkeren Ausgewogenheit der Motive und räumlicher Kohärenz, sodass jedes Element atmen kann, ohne seine Nachbarn zu beengen.
Zu den wichtigsten Verbesserungen gehören:
- Intelligenteres Framing , Motive werden mit echter Absicht positioniert, nicht durch glücklichen Zufall
- Hintergrundwahrnehmung , umgebende Elemente ergänzen den Hauptfokus, anstatt mit ihm zu konkurrieren
- Kontextuelle Wortbeziehungen , V7 liest Prompts ganzheitlich und versteht, wie Motive zueinander in Beziehung stehen
Das Ergebnis sind Kompositionen, die durchdacht wirken, anstatt zusammengestückelt. Komplexe Szenen, die früher ein kleines Glücksspiel waren, verhalten sich nun mit etwas, das man als redaktionelle Sicherheit bezeichnen könnte.
Komplexe Eingabeaufforderungspräzision
Midjourney V7 einen langen, dicht geschichteten Prompt zu geben fühlte sich früher an, als würde man jemandem eine Einkaufsliste überreichen und hoffen, dass er nicht mit der falschen Marke von allem zurückkommt. Diese Reibung ist weitgehend verschwunden. V7 verarbeitet ausführliche Beschreibungen, ohne den roten Faden zu verlieren, was bedeutet, dass Prompt-Strukturierung nun Mühe belohnt, anstatt Ambition zu bestrafen. Detail-Schichtung funktioniert tatsächlich , Outfits, Ausdrücke, Umgebungen und Akzente landen dort, wo sie hingehören. Wortreihenfolge ist ebenfalls wichtig; das Platzieren des Hauptmotivs am Anfang schafft einen klaren Fokus, während unterstützende Details natürlich folgen. Vollständige, grammatikalisch korrekte Sätze übertreffen fragmentierte Keyword-Anhäufungen, was erfreuliche Neuigkeiten für alle sind, die es vorziehen, wie ein Mensch zu schreiben. Das Modell liest den Kontext, anstatt nur nach Schlagwörtern zu suchen, wodurch komplexe kreative Visionen tatsächlich umsetzbar werden, ohne dass man einen Informatikabschluss benötigt, um sie zu kommunizieren.
Ist Midjourney V7 den Wechsel wert?

Ob Midjourney V7 einen Wechsel rechtfertigt, hängt größtenteils davon ab, was ein Nutzer tatsächlich von einem KI-Bildgenerator benötigt. Nutzerfeedback hebt konsistent drei Bereiche hervor, in denen V7 die Nase vorn hat:
- Charakterkonsistenz über mehrere Bilder hinweg durch Omni Reference
- Fotorealistische Portraitqualität mit einer Ununterscheidbarkeitsrate von 78 % gegenüber echten Fotografien
- Schnellere Ideenfindung durch den Draft-Modus bei geringerem GPU-Verbrauch
Für Kreative, die kommerzielle Projekte oder Workflows mit mehreren Bildern verwalten, ist der Fall für ein Upgrade eindeutig. Die Abonnementpreise bleiben gleich, sodass die Entscheidung nicht finanzieller, sondern funktionaler Natur ist.
V6 behauptet sich weiterhin bei einfachen, einmaligen Generierungen. Wer jedoch zuverlässiges Text-Rendering, konsistente Charaktere oder Portraitrealismus benötigt, wird V7 als deutlich überlegen empfinden. V8 Alpha existiert zwar, ist aber nicht produktionsreif , V7 bleibt vorerst die vernünftige und stabile Wahl.


