Midjourney vs ChatGPT: Welchen Bildgenerator brauche ich wirklich?


Midjourney vs ChatGPT

Bilder mithilfe von KI zu erstellen ist heute keine Neuheit mehr. Es gibt mittlerweile mehrere Anbieter, die allesamt behaupten ihre Bildkreationen seien die Besten. Die zwei größten Bildgeneratoren sind AI Midjourney und DALL-E 3 for ChatGPT. Wir haben bereits beide Anwendungen einzeln beleuchtet, doch in diesem Beitrag stellen wir die Funktionen und Ergebnisse der künstlichen Intelligenzen gegenüber, damit Du besser entscheiden kannst in welches Programm Du investieren willst.

Überblick Midjourney

Midjourney ist eine KI, die Bilder anhand von Prompts erstellt. Diese werden nach dem Befehl „/image“ eingegeben, damit das Computerprogramm weiß, dass ein Bild gewünscht ist. Bei der eigentlichen Beschreibung der Grafik kann man sich sehr kurz halten. Die KI kann sogar mit Stichpunkten arbeiten. Tatsächlich sind zu viele Infos in diesem Bereich nicht hilfreich. Zu komplizierte oder ausschweifende Beschreibungen führen nämlich meist zu keinen guten Ergebnissen.

Anhand der eingegebenen Informationen generiert die KI vier Versionen des gewünschten Bildes. Je nachdem welches man hier auswählt, passt sich das System an den oder die Nutzer:in an. So sollen dann alle weiteren Bilder immer individueller werden, da die KI lernt und sich ständig weiterentwickelt. Was hier auffällt ist, dass deswegen die Frauen und Männer in Midjourney-Bildern für unsere Gesellschaft stereotypisch schön sind. Das Modell hat gelernt, dass die Nutzer:innen attraktive Bilder auswählen und optimiert sich nun auf eine Art kollektiver Vorstellung von Schönheit.

Midjourney Version 6 ist im Dezember 2023 als Alpha gestartet. Noch im Sommer erzeugte die vorherige Version Aufsehen, da dadurch die Inpainting-Funktion auf den Markt gebracht wurde.

Überblick DALL-E 3 for ChatGPT

ChatGPT ist eine sprachbasierte künstliche Intelligenz. Dies bedeutet, dass das Tool zwar durch die Veröffentlichung der GPT-4 Version nun auch Bilder erstellen kann, aber diese Funktion nur ein Teil des Werkzeugkoffers ist. In erster Linie geht es hierbei um textbasierte Nachrichten. Dies wird auch beim prompten klar. Im Gegensatz zu Midjourney kann man die Beschreibung des gewünschten Bildes so ausführlich gestalten wie man möchte. Das Sprachverständnis ist bei ChatGPT weit entwickelt, was bedeutet, dass die KI gut mit detaillierten Formulierungen arbeiten kann. Im Gegensatz zu Midjourney generiert ChatGPT jedoch nur ein Foto per Prompt.

Möchtest Du dich über weitere Features der KI von Open AI informieren, findest Du auf contentmanager.de Beiträge über Browser Extensions, Plugins oder den ChatGPT Store.

Die Stärken: Midjourney vs ChatGPT

Midjourney glänzt, wenn man sich die Zeit nimmt, kurze, prägnante und gut definierte Prompts zu erstellen. Wir haben einen Guide erstellt, anhand dessen man gute Beschreibungen seiner Wunschvorstellung erstellen kann, sodass die KI das ideale Ergebnis liefert. Die Auswahl zwischen vier Versionen ist ebenfalls vorteilhaft. Auch, dass das System kontinuierlich dazu lernt und sich an die Endkund:innen anpasst, muss positiv hervorgehoben werden. Die Qualität der Bilder ist hervorragend. Die Auflösung ist hoch und vor allem bei kreativen Prompts zeigt sich die zukunftsorientierte Seite von Midjourney. Das Inpainting-Feature macht es einfach die Bilder zu erweitern oder verkleinern und auch innerhalb des Fotos Veränderungen durchzuführen.

ChatGPT basiert auf einem umfangreichen Sprachmodell und hat weitaus bessere Fähigkeiten, große Mengen an Text und Beschreibungen zu verstehen. Man könnte zum Beispiel in ChatGPT den Inhalt dieses Artikels posten und sagen: „Erstelle ein Bild, um diesen Artikel zu illustrieren“. So ist man vor allem beim prompten sehr frei und kann so detailreich und präzise oder so ungenau und allgemein, wie man möchte, das gewünschte Foto beschreiben. Außerdem wird ChatGPT oft dafür gelobt wie exakt die Prompts umgesetzt werden. Während bei Midjourney manchmal ausdrücklich erwähnte Merkmale nicht im Bild umgesetzt werden, ist DALL-E 3 hier sehr akkurat.

Die Schwächen: Midjourney vs ChatGPT

Ein großer Kritikpunkt bei Midjourney ist der Mangel an Abwechslung. Viele Bilder folgen dem gleichen Stil, dem üblichen Midjourney-Look. So bekommt man zwar vier Varianten, doch diese ähneln sich alle und wenn man mit den Grundstrukturen nicht zufrieden ist, gibt es keine wirklichen Optionen. Die vier Varianten sind nur zufriedenstellend, wenn die KI den Kerngedanken des Prompts verstanden und richtig umgesetzt hat und der oder die Nutzer:in sich dann zwischen Nuancen entscheiden kann. Außerdem würde das zuvor aufgeführte Beispiel mit dem Artikelbild bei Midjourney nicht funktionieren. Es hat nicht die gleiche Fähigkeit, Sprache zu verarbeiten und verlässt sich darauf, dass man in der Lage ist, gute Prompts zu erstellen. So steht und fällt die Arbeit mit dem Wissen und Geschick der Nutzer:innen.

ChatGPT folgt den Prompts genauestens. Dies hat aber auch zur Folge, dass das Endergebnis nicht das kreativste ist und man gewünschte Einzelheiten in der Beschreibung aufnehmen muss. Außerdem bindet die KI auch urheberrechtlich geschützte Inhalte in ihre Bilder mit ein. Das bedeutet, dass Rechtsfragen entstehen und man das Endergebnis nicht direkt verwenden kann. Wie man KI-generierte Inhalte richtig kennzeichnet, erklären wir Dir hier. Letztlich ist ein großes Manko der Bildgeneration bei ChatGPT, dass man die erstellten Bilder nicht anpassen kann. Wenn das Ergebnis theoretisch passt, man jedoch noch Kleinigkeiten verändern möchte und dies der KI mitteilt, erstellt sie direkt ein neues Bild. Dies kann sich dann gegebenenfalls stark vom Original unterscheiden und aus kleinen Veränderungen entsteht ein komplett neues Produkt.

Die Kosten

DALL-E 3 kann man bei ChatGPT nutzen, wenn man den Plus Account hat. Die Premiumversion des Chatbots kostet umgerechnet 22 Euro pro Monat. Hier hat man dann auch Zugriff auf die anderen Features, die OpenAI seinen bezahlenden Kund:innen zur Verfügung stellt. Midjourney hat vier Bezahlpläne von Basic bis Mega. Für den gelegentlichen Gebrauch ist der Basisplan ausreichend und kostet 10$ pro Monat.

Fazit: Midjourney vs ChatGPT

Jede Plattform hat ihre eigenen Stärken und Schwächen. Dall-E ist nahtlos in ChatGPT integriert, bietet einen benutzerfreundlichen Zugang und schnellere Ergebnisse. Seine Fähigkeit, durch das zugrundeliegende Sprachmodell komplexe Eingabeaufforderungen zu verstehen und zu interpretieren, ist ein erheblicher Vorteil, insbesondere bei Aufgaben, die das Verstehen umfangreicher Beschreibungen erfordern.

Midjourney erfordert zwar etwas mehr Aufwand bei der Erstellung von präzisen Prompts, zeichnet sich aber durch künstlerische Qualität und Detailtreue aus. Der kontinuierliche Feedback- und Optimierungsprozess in Midjourney scheint zu dieser hohen Qualität beizutragen, was besonders bei künstlerischeren oder detaillierteren Aufgaben wie Illustrationen im Animationsstil und komplexen Landschaften auffällt.

Auch die Aspekte Geschwindigkeit und Kosten unterscheiden die beiden Plattformen. Viele Anwender:innen werden bereits einen ChatGPT Plus-Account haben und können dadurch Dall-E als zusätzliches Extra nutzen. Für die gelegentliche Nutzung ist dies dann ausreichend. Für Marketeers stellt sich die Frage, ob man Midjourney noch braucht, wenn man schon die Premiumversion von ChatGPT besitzt? Da das leistungsfähige KI-Modell von Midjourney für künstlerische Illustration und kreative Bilderzeugung bekannt ist, lohnt sich auf alle Fälle das Ausprobieren, um zu sehen was für das eigene Arbeitsmodell besser funktioniert.

Die Wahl zwischen Midjourney vs ChatGPT hängt weitgehend von den Anforderungen der Benutzer:innen ab. Für Aufgaben, die eine schnelle, unkomplizierte Bilderzeugung für geschäftliche Zwecke oder komplexe Textbeschreibungen erfordern, ist Dall-E besser geeignet. Für Anwender:innen, bei denen künstlerische Qualität, Detailtreue und Stil im Vordergrund stehen, hat Midjourney immer noch einen deutlichen Vorsprung.

Beide Plattformen demonstrieren den rasanten Fortschritt in der KI-gesteuerten Bilderzeugung, die sich jeweils auf ihre eigene Art und Weise weiterentwickeln und verbessern. Wenn die KI-Technologie weiter voranschreitet, wird sich die Kluft zwischen diesen Plattformen in Bezug auf Fähigkeiten und Qualität möglicherweise verringern, so dass sie noch leistungsfähigere Werkzeuge für Kreative und Profis bieten.

Previous OMT-Toolkonferenz am 29.02.2024 - Best Practices & Networking
Next Metadaten richtig anlegen - Verstecke Deine Seite nicht!

No Comment

Leave a reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

3 + 5 =