ChatGPT-4 Omni: Voice, Vision und Bilderstellung Updates


Updates im Überfluss! OpenAI hat eine neue Version seines Chatbots veröffentlicht: ChatGPT-4 Omni ist verfügbar – und zwar für alle. Die neue Generation bringt einige verbesserte Funktionen mit. Wir haben das neue Modell getestet und geben Dir in diesem Beitrag eine Übersicht über die Neuerungen.

O steht für omnimodal

Die neue Version des Chatbots vereint viele Funktionen, die bisher auf verschiedene Modelle aufgeteilt wurden. Das Omni stammt daher, dass Text-, Audio- und Video-Funktionen miteinander kombiniert wurden. Der große Unterschied zu ChatGPT-4? Da es nun ein einziges Modell ist und nicht länger mehrere, die zusammenarbeiten, soll die Verarbeitung nahtloser, schneller und effizienter vonstattengehen. Und tatsächlich hat sich die Geschwindigkeit der Antworten immens verbessert. Dieselben Fragen werden von ChatGPT-4 Omni in einem Bruchteil der Zeit beantwortet, die das Vorgängermodell dafür gebraucht hat.

Du willst Chatbots in Deinem Unternehmen einsetzen?

Wir haben in unserem Marktüberblick 12 Lösungen gegenübergestellt. Anhand von 143 Attributen und 13 Kategorien kannst Du Dir so ein Bild darüber machen, welche Lösung die Richtige für Deine Bedürfnisse ist.

Voice-Funktion wurde verbessert

Das große Problem bei vielen Computer-Sprachmodellen ist, dass sie sich genau so anhören. Die Antwort, die man erhält, wird in einer monotonen Stimme vorgetragen. Das stört manche vielleicht nicht, aber OpenAI hat es sich zur Aufgabe gemacht, der Voice-Funktion einen menschlichen Touch zu geben. So kann diese dank des Updates jetzt ihre Antworten mit Emotionen untermauern. Der Haken? Bisher wurde diese Funktion nur auf Englisch vorgestellt und ist auch nur für Plus User verfügbar. Wann dieses Feature auch auf Deutsch einsatzbereit ist, steht noch nicht fest. Dies ist sicherlich auch davon abhängig, wie gut die emotionale Voice-Funktion bei Nutzer:innen auf Englisch ankommt.

Vision-Funktion entwickelt sich weiter

Die Vision-Funktion war bisher darauf limitiert, dass der oder die Nutzer:in ein statisches Foto schoss und dieses dann als Grundlage für die Antworten der KI genutzt werden konnte. Nun aber arbeiten Voice- und Vision-Funktion zusammen. Das Ergebnis? Man kann dem Chatbot im Livestream seine Umgebung zeigen und dieser analysiert und kommentiert das Gefilmte in Echtzeit. Gepaart mit der neuen Emotionalität der Sprachfunktion ist diese Weiterentwicklung ein zusätzlicher Schritt dem Chatbot einen humanen Hauch zu geben.

Bilderstellung bei ChatGPT-4 Omni

Wer mit DALL-E bereits Bilder erstellt hat, weiß, dass die KI mit Schriftzügen darauf noch ihre Probleme hat. Zunächst sollte diese Problematik mit dem DALL-E Editor aus der Welt geschafft werden. Obwohl das Editieren der erstellten Bilder bereits ein guter Verbesserungsschritt war, war der Prozess zum perfekten Foto immer noch zäh und mehrstufig. Dieses Problem soll nun der Vergangenheit angehören und ChatGPT-4 Omni einfach Bilder mit Schriftzügen erstellen können. In der Praxis allerdings funktioniert diese Funktion noch nicht einwandfrei – jedenfalls nicht in unserem Test:

ChatGPT-4 Omni Bilderstellung
Ergebnis der Bilderstellung mit ChatGPT-4 Omni

ChatGPT Desktop App

Bezahlende User:innen, die ChatGPT-4 Omni auf einem Mac nutzen, haben nun Zugang zur ChatGPT Desktop App. Die Vorteile dieser Funktion sind die engere Zusammenarbeit zwischen Mensch und Chatbot. So ist der KI-Assistent direkt im Computer und kann auch in anderen Anwendungen Hilfe leisten. Die App für Windows soll Ende des Jahres ebenfalls auf den Markt kommen.

Mehr Funktionen für free User:innen

Die kostenlose Version von ChatGPT war bisher oft von Neuerungen ausgeschlossen. So konnten seit Einführung letzten Jahres nur die Chatbots von Plus Kund:innen die Internet-Suchfunktion nutzen. Dies hat sich nun geändert. Nutzer:innen der kostenlosen Version stehen jetzt ebenfalls folgende Funktionen zur Verfügung:

  • das Internet zu durchsuchen;
  • das Erstellen von GPTs und Zugriff auf den GPT Store;
  • die Bilderkennung mit ChatGPT (auch das neue Vision-Feature des Livestreams);
  • die Memory-Funktion: ChatGPT merkt sich den Kontext und liefert so bessere Antworten;
  • Advanced Data Analysis: ChatGPT kann eingegebene Daten auswerten und interpretieren.

Plus Nutzer:innen haben für all diese Funktionen noch immer ein höheres Tageslimit als kostenlose User:innen. Jedoch ermöglicht diese Öffnung einer größeren Masse die Nutzung der Sonderfunktionen, was ChatGPT weiter in den Alltag der Menschen rückt.

Fazit: ChatGPT-4 Omni

Wie diese neuen Funktionen performen wird sich erst noch zeigen. Doch eines ist klar: OpenAI ist der Marktführer im Bereich der KI-Chatbots. Dies haben sie mit ihrer neuen Vorstellung verdeutlicht. Die Frage, wann die mit großer Spannung erwartete neue Version, ChatGPT-5, veröffentlicht wird, rückte bei dem ganzen Trubel jedoch etwas in den Hintergrund. Die Unterschiede zwischen ChatGPT-4 und ChatGPT-4 Omni sind groß und das Ausprobieren der neuen Funktionen sollte die Tech-Branche erst einmal für einige Zeit beschäftigen.

Bildquellen

Previous Automatisierte Marketing Kampagnen planen – so gehst Du vor
Next Podcast Ads: Alles, was Du über den Werbekanal wissen musst

No Comment

Leave a reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

vier × 4 =