Der Papst in einer Balenciaga-Jacke oder Donald Trump, der von der Polizei zu Boden geworfen und verhaftet wird. Beide Bilder waren nicht echt und gingen 2022 doch um die Welt. Sie waren künstlich generiert vom KI-Bildgenerator Midjourney. Doch was kann eigentlich die AI, die solche Schlagzeilen machte? In unserem Beitrag zeigen wir Dir, wie das System funktioniert, und geben Dir wertvolle Tipps, wie Du mit der AI Midjourney die besten Ergebnisse erzielst.
Was ist Midjourney?
Midjourney ist eine revolutionäre künstliche Intelligenz (KI), die fähig ist, Kunstwerke mithilfe von KI zu erschaffen. Das Programm stammt aus dem Midjourney Research Institute, einem renommierten Forschungsinstitut mit Sitz in San Francisco, Kalifornien, USA. Gründer dieses Instituts ist Entwickler David Holz, der zuvor Mitgründer des Unternehmens Leap Motion war und auch für die NASA tätig war. Midjourney ist seit dem 12. Juli 2022 in Form einer offenen Betaversion erhältlich. Seitdem suchen die Entwickler:innen ständig nach Optimierungen ihrer KI und arbeiten an neuen, noch besseren Versionen. Die erste Alpha-Version wurde im März 2023 veröffentlicht.
Midjourney gab es zuvor auch schon als kostenlose Testversion. Diese haben Nutzer:innen jedoch missbraucht, um Deepfakes zu erstellen. Deswegen nahm David Holz die Testversion vom Markt. Wenn Du wissen möchtest, wie man KI Inhalte erkennt oder die Manipulation von Bildern durch KI vermeiden kann, helfen Dir unser weiteren Beiträge zu diesen Themen weiter.
So funktioniert die AI Midjourney
Über Befehle an einen Discord-Bot steuert man die künstliche Intelligenz. Damit die AI Midjourney seine KI-Kunst erschaffen kann, müssen die Nutzer:innen einen Prompt eingeben. Dieser Prompt dient dem System dann als Basis für die Erstellung des Bildes. Wichtig ist: Am Anfang des Promptes muss immer der Befehl „/imagine“ stehen. Im Anschluss daran folgt dann die eigentliche Beschreibung des Bildes – oder vielmehr: die Inhalte, die zu sehen sein sollten. Denn bei Midjourney reicht es stichpunktartig wiederzugeben, was im Bild enthalten sein soll. Zu komplizierte oder ausschweifende Beschreibungen führen zu keinen guten Ergebnissen. Am Ende des Prompts können Nutzer:innen das gewünschte Format des KI-generierten Bildes festlegen. Dafür müssen sie den Tastenbefehl –ar und das gewünschte Format (beispielsweise 3:2) hinzufügen. Midjourney erstellt anhand dieser Daten nun das Bild direkt im bevorzugten Format.
Die Bilder zeigt die AI Midjourney in einer Vorschau an. Insgesamt gibt das System vier mögliche Entwürfe heraus. Die Nutzer:innen können dann selbst entscheiden, welches Design ihnen am meisten zusagt. Jetzt haben Nutzer:innen noch die Möglichkeit, die Bilder zu skalieren (U1-U4) oder verschiedene Varianten des Bildes zu erhalten (V1-V4). Sollte kein Bild vorhanden sein, dass dem Prompt entspricht oder Fehler enthält, können Nutzer:innen sich nochmal komplett neue Bilder generieren lassen – eben so lange, bis sie mit dem Ergebnis zufrieden sind. Die KI ist in der Lage, eine Vielzahl von Bildern zu generieren. Egal ob Produktbilder, Porträts von Menschen, Landschaftsaufnahmen, Comicbilder, oder Tierbilder – Midjourney generiert Dir genau das Bild, was Du brauchst.
Midjourney als Gefahr für Künstler?
Und Midjourney macht seinen Job erstaunlich gut: Im Juni 2022 konnte ein/e Teilnehmer:in, mit einem von Midjourney erstellten Bild, bei einer Kunstausstellung den ersten Preis gewinnen – und sorgte damit für einen regelrechten Aufschrei in der Kunstszene. Die Künstler:innen kritisierten die Kunstausstellung. Denn das Problem war: Die Preisrichter des Wettbewerbs haben den Preis vergeben, ohne zu wissen, dass es sich dabei um ein KI-generiertes Bild handelte. Kein Wunder also, dass Midjourney besonders bei Künstler:innen auf eher gemischte Gefühle stößt. Besonders in puncto Urheberrecht wurden die Stimmen der Kritiker:innen immer lauter. Sie werfen den Entwickler:innen vor, die KI mit urheberrechtlich geschützten Inhalten trainiert zu haben. Wie wichtig es ist, KI-generierte Inhalte als solche zu markieren, erfährst Du in einem eigenen Artikel.
KI Konferenz nicht verpassen!
Richtig prompten: so erhältst Du die besten Ergebnisse bei Midjourney
Prompting ist ein wichtiger Teil des Interaktionsprozesses mit KI-Systemen wie Midjourney. Es bezieht sich auf den Text oder die Anweisungen, die Du der KI gibst, um sie zu leiten, was sie tun soll. Wir haben Dir einige hilfreiche Tipps zusammengestellt, damit Du noch effektivere Prompts für Midjourney erstellen kannst:
Sei spezifisch
Je detaillierter und spezifischer Deine Beschreibung ist, desto besser kann Midjourney Deine Anforderungen erfüllen. Wenn Du beispielsweise ein Bild von einem Wald bei Sonnenuntergang erstellen möchtest, wäre es hilfreich, Details wie die Arten von Bäumen, die Farben des Himmels und andere Aspekte der Szene zu beschreiben. Achte allerdings darauf, den Prompt nicht länger als nötig zu gestalten. Kurze prägnante Prompts – ungeachtet der Grammatik oder Rechtschreibung – reichen der KI, um Ergebnisse zu generieren. Kürzere Prompts kann sie außerdem schneller bearbeiten.
Nutzen Metaphern und Vergleiche
Wenn es schwierig ist, genau zu beschreiben, was Du willst, kannst Du Metaphern oder Vergleiche verwenden, um Deiner Beschreibung mehr Kontext zu geben. Zum Beispiel, wenn Du ein Bild von einer Person erstellen möchtest, die „so stark wie ein Löwe“ aussieht, würde Midjourney versuchen, ein Bild zu erstellen, das diese Eigenschaften darstellt.
Sei experimentierfreudig
Verschiedene Formulierungen können zu unterschiedlichen Ergebnissen führen. Wenn Du also nicht genau das bekommst, was Du Dir vorgestellt hast, versuche, Deine Beschreibung zu ändern und versuche es erneut. Du wirst sehen: Übung macht den Meister.
Gib Feedback
Midjourney bietet die Möglichkeit, zwischen vier generierten Entwürfen zu wählen und sie zu bearbeiten oder neue zu generieren, wenn sie nicht den Erwartungen entsprechen. Nutze diese Funktionen, um Deine Ergebnisse zu verbessern und Midjourney dabei zu helfen, Deine Präferenzen besser zu verstehen.
Verstehe die Grenzen der KI
Obwohl KI-Systeme wie Midjourney unglaublich leistungsfähig sind, gibt es immer noch Grenzen für das, was sie tun können. Zum Beispiel kann es schwierig sein, sehr abstrakte Konzepte oder sehr komplexe Szenen zu erzeugen. Es ist auch wichtig zu beachten, dass die KI nicht „denkt“ oder „versteht“ auf die gleiche Weise wie ein Mensch, sodass ihre Interpretationen von Prompts manchmal unerwartet sein können. Auch Missverständnisse sind keine Seltenheit, wenn Du Begriffe benutzt, die eine doppelte Bedeutung haben. So könnte beispielsweise das Wort Schloss einerseits als Märchenschloss oder als Vorhängeschloss verstanden werden. Überlege Dir also gut, wie Du Deine Prompts formulierst und welche Begriffe Du dabei verwendest. Der KI können außerdem Kommas, Klammern oder Gedankenstriche in den Prompts helfen, um diese besser zu verstehen.
Lerne aus Beispielen
Schau Dir die Beispiele von anderen Nutzer:innen an, um zu sehen, welche Arten von Prompts zu erfolgreichen Ergebnissen führen. Lerne aus Deinen eigenen Fehlern und denen der anderen. So kannst Du Deine Prompts perfektionieren und die besten Ergebnisse erzielen.
Füge Stimmungen und Gefühle hinzu
Emotionaler Kontext kann die KI dabei unterstützen, ein Bild zu erstellen, das die gewünschte Atmosphäre einfängt. Du könntest beispielsweise Begriffe wie „friedlich“, „fröhlich“ oder „düster“ in Deine Beschreibung einfügen, um die Stimmung des gewünschten Bildes zu definieren.
Nutze die Geschichte
Wenn Du ein Bild erstellen möchtest, das eine bestimmte Geschichte oder ein bestimmtes Konzept darstellt, kann es hilfreich sein, dieses Element in Deinen Prompt einzubeziehen. Zum Beispiel könnte ein Prompt wie „Ein Ritter, der sich auf eine gefährliche Quest vorbereitet“ die AI Midjourney dazu veranlassen, ein Bild zu erstellen, das diese Narrativelemente enthält.
Sei geduldig und offen
Das KI-generierte Kunstwerk entspricht möglicherweise nicht immer genau Deiner ursprünglichen Vision, kann aber dennoch interessant und wertvoll sein. Sei offen für überraschende oder unerwartete Ergebnisse und sehe sie als Teil des kreativen Prozesses. Midjourney kann schließlich nur so gute Ergebnisse liefern, wie die Prompts, die Du der KI gibst. Sei Dir im Vorfeld darüber im Klaren, was Du haben möchtest – aber eben mit einem gewissen Spielraum in der Interpretation. Vielleicht liefert Dir die KI sogar neue Ideen.
Bitte um mehrere Entwürfe
Midjourney erstellt zunächst vier mögliche Entwürfe, basierend auf Deinem Prompt. Wenn keiner von ihnen Deinen Vorstellungen entspricht, hast Du die Möglichkeit, alle vier Entwürfe zu verwerfen und vier ganz andere Bilder anzufordern. Scheue Dich also nicht davor, nochmal neu anzufangen. Versuche Deinen Prompt weiter zu optimieren und sieh Dir genau an, bei welchen Inhalten Midjourney bei der Erstellung Probleme hatte.
Denk daran, dass das Prompting eher eine Kunst als eine Wissenschaft ist und es einige Zeit und Übung erfordern kann, um effektive Prompts zu erstellen. Der Schlüssel ist, zu experimentieren, zu lernen und Spaß am Prozess zu haben.
Achte beim Prompten auf diese Parameter
Hast Du ein bestimmtes Bild im Kopf, dass Du visualisiert haben möchtest, solltest Du dieses genau beschreiben. Denn je ungenauer Dein Prompt, desto variabler auch das Ergebnis. Die folgenden Parameter kannst Du zur detaillierteren Beschreibung Deines KI-Bildes nutzen:
- Subjekt: Was ist auf dem Bild zu sehen?
Person, Tier, Charakter, Objekt oder Ort - Medium: Wie soll das Bild dargestellt werden?
Als Foto, Öl- oder Acrylgemälde, Zeichnung, Collage, Grafik, Aquarell, Illustration - Umgebung: Wo findet die gewünschte Szene statt?
Drinnen, draußen, in der Küche, im Ozean, in New York, auf einem Hochhausdach - Farbgebung: In welchen Farbtönen soll das Bild dargestellt werden?
Sepia, als Schwarz-Weiß Bild, in pastellfarben, monochromatisch - Stimmung: Soll das Bild eine gewisse Stimmung ausdrücken?
bedrohlich, ruhig, friedlich, aufgeregt, dramatisch, fröhlich - Licht: Wie soll die Szene des Bildes beleuchtet sein?
Dämmerlicht, Neon, Tageslicht, bei Nacht, weiches oder kaltes Licht, Rotlicht, Studiobeleuchtung - Komposition: Aus welches Perspektive soll das Subjekt gezeigt werden?
Close-Up, im Profil, aus der Frosch- oder Vogelperspektive, im Porträt oder als Ganzkörperbild
Die AI Midjourney im Praxistest: Das sind die Ergebnisse
Wir haben Midjourney natürlich selbst einmal getestet und ein paar Beispielprompts entwickelt. Hier siehst Du die Ergebnisse:
Landschaft: „/imagine peaceful alpine landscape at sunset, snow-capped peaks, in the foreground a crystal clear mountain stream by a green meadow with wild flowers –ar 3:2“
Charakterporträt: „/imagine portrait of an old bearded pirate, he has a twinkling eye and wears a tricorn –ar 3:2“
Surreales Bild: „/imagine giant butterflies, ocean with neon waves, city of cristal at horizon –ar 3:2“
Jeder dieser Prompts gibt Midjourney eine klare Vorstellung davon, was Du erstellen möchtest, und enthält genügend Details, um der KI einen Kontext und eine Richtung für Deine Arbeit zu geben. Bitte beachte aber, dass die Qualität und der Stil des endgültigen Bildes immer noch stark von den spezifischen Fähigkeiten und Einschränkungen der KI abhängen. Erwarte also keine Wunder.
Tricks für die Arbeit mit Mitjourney
Es gibt gewisse Elemente, die man bei Midjourney nutzen kann, um einzelne Worte im Prompt anders zu gewichten. Das klappt besonders gut bei aneinandergereihten Substantiven. So zum Beispiel beim Wort Käsekuchen. Promptet man einfach nur dieses Wort, erhält man ein Bild von einem Käsekuchen. Setzt man aber hinter das Wort „Käse“ zwei Doppelpunkte (::), legt Midjourney den Fokus darauf – und Du erhältst ein Bild von einem Kuchen, der vollständig aus Käse besteht. Auch die Gewichtung lässt sich so anpassen, indem man noch eine Zahl hinter die Doppelpunkte setzt (Käse::3 Kuchen).
Wenn Du mit Deinen eigenen Prompts nicht so erfolgreich bist, wie erhofft, hast Du außerdem die Möglichkeit, auch dies in die Hände einer KI zu legen. Frage doch einfach mal ChatGPT nach passenden Prompts zur Bildgenerierung. Mit der „Remix“ Funktion von Midjourney kannst Du außerdem die Bildkomposition eines bereits generierten Bildes für neue Generierungen anwenden. So hast Du bei allen Deinen KI-Bildern denselben Look.
Unser Fazit – es braucht Zeit
Midjourney ist ein gutes Tool, um schnell und einfach visuell ansprechende Bilder zu generieren. Doch nicht jeder Prompt funktioniert auf Anhieb. Deswegen ist besonders auf der Nutzerseite ein gewisses Maß an Experimentierfreudigkeit gefragt. Auch wir haben bei unserem Test darauf geachtet, Midjourney gerade so viel Input zu geben, dass es nicht überfordert ist und sich auf die wesentlichen Inhalte beschränken kann. Denn mit ganzen Romane an Bildbeschreibungen kommt man bei Midjourney leider nicht sehr weit.
Auch Rechtschreibung und Grammatik spielt erstmal beim Prompting keine Rolle. Die KI versteht die Prompts ohnehin anders als wir Menschen und baut sich aus den Bestandteilen ihr eigenes Bild zusammen – im wahrsten Sinne des Wortes. Wer also Midjourney nutzt und nicht die gewünschten Ergebnisse erreicht, der sollte seine Prompts ganz genau unter die Lupe nehmen. Alles, was überflüssig ist, sollte auch nicht im Prompt enthalten sein. – und seien es nur ein paar Binde- oder Füllwörter. Präzision ist also gefragt und natürlich auch etwas Zeit. Denn wie sagt man so schön: Es ist noch kein Meister vom Himmel gefallen
Richtiges Prompten ist nicht nur bei Midjourney wichtig. Auch bei ChatGPT hat die Qualität der Prompts großen Einfluss auf die Qualität der Ergebnisse. In unserem Beitrag „ChatGPT richtig briefen“ erhältst Du wichtige Tipps und Tricks für die Arbeit mit ChatGPT.
Bildquellen
- 2151639628 (1): Image by freepik
- AI Midjourney: Image by freepik
Danke für die gute Anleitung! Habt ihr noch Beispiel-Prompts?