Google Gemini: Das kann der KI-Chatbot von Google


Google Gemini: Neues Sprachmodell aus dem Hause Google

Generative Modelle wie ChatGPT haben eine regelrechte Welle der KI-Entwicklung ausgelöst. Fast täglich liest man von neuen Anbietern, die sich mit den Big-Playern des Markts messen wollen. Vorne mit dabei ist natürlich auch Suchmaschinenriese Google mit seinem auf künstlicher Intelligenz basierenden Chatbot Google Gemini, vormals Google Bard. Doch was genau verbirgt sich hinter dem KI-System? Und kann es Google Gemini mit dem derzeitigen Marktführer ChatGPT aufnehmen? Wir haben uns Google Gemini einmal genauer angeschaut.

Künstliche Intelligenz ist wohl das Nummer-Eins-Thema der Digitalbranche. Den Startschuss setzte die Firma OpenAI Ende November 2022 mit ihrem KI-Chatbot ChatGPT. Wenig später zogen bekannte Unternehmen nach und brachten ebenfalls KI-Modelle auf den Markt. So auch der Software-Entwickler Microsoft, welcher eine neue Version der Suchmaschine Bing ankündigte. Bing AI heißt die neue Entwicklung und erweitert die Funktionen einer Suchmaschine um eine künstliche Intelligenz. Eine direkte Kampfansage von Microsoft an Google.

Laut Statista hält Google aktuell auf dem Markt der Suchmaschinen einen Marktanteil von knapp 80 %. Doch neuere Suchmaschinen, die künstliche Intelligenz mit in ihre Suche einbeziehen, könnten Google diesen Rang nun streitig machen. Kein Wunder also, dass Suchmaschinenriese Google ein Modell entwickelt hat, das ChatGPT und Co. in nichts nachstehen soll. Mit seinem KI-Sprachmodell „Google Gemini“ schickt das Tochterunternehmen von Alphabet Inc. einen neuen Kandidaten in den Wettkampf um die beste künstliche Intelligenz.

Das ist Google Gemini

Definition Google Gemini

Google Gemini ist ein Sprachmodell, welches das Forschungsteam von Google entwickelt hat. Google Gemini vereint, wie sein Konkurrent ChatGPT, die Technologie eines Chatbots mit einem generativen Modell. Mittels künstlicher Intelligenz ist das System dazu in der Lage, kreative Inhalte zu generieren und nahezu menschliche Konversationen mit seinen Nutzer:innen zu führen. Die Basis für das System bildete zunächst die von Google entwickelte KI LaMDA, bevor man auf das leistungsfähigere PaLM und aktuell auf Gemini Pro 1.5 zurückgriff.

Funktionsweise von Google Gemini

Google Gemini ist im Grunde ähnlich zu einer Suchmaschine. Auch hier werden in ein Dialogfeld Suchanfragen, Aufforderungen oder dergleichen eingegeben. Das Sprachmodell generiert daraufhin verschiedene Antworten, die für die Nutzer:innen infrage kommen könnten. Das System lässt seinen Nutzer:innen somit die Wahl, für welches Ergebnis sie sich entscheiden möchten. Mit seinen Antworten liefert Google Gemini außerdem dazugehörige Quellennachweise, damit Nutzer:innen besser nachvollziehen können, woher die Antworten stammen. Es gilt allerdings auch hier die Quellen kritisch zu überprüfen, die Gemini seinen Nutzer:innen präsentiert.

Grundlage für Gemini ist die Serie multimodaler Sprachmodelle Gemini. Sie wurde vom Google-Tochterunternehmen DeepMind entwickelt und baut auf den Vorgängermodellen LaMDA und PaLM.

Das Large Language Model LaMDA von Google basiert auf sogenannten „Transformern“, die eine Architektur von neuronalen Netzwerken verwenden. PaLM (Pathways Language Model) ist ebenfalls Transformer-basiert, jedoch viermal leistungsfähiger als LaMDA.

KI Konferenz

Wer kann Google Gemini nutzen?

Der CEO von Alphabet, Sundar Pichai stellte Gemini im Februar 2023 erstmals der Öffentlichkeit vor. Nach der Veröffentlichung stand die damals noch Google Bard genannte Innovation einer ausgewählten Gruppe von Nutzer:innen zu Testzwecken zur Verfügung. Heute ist der im Februar 2024 zu Gemini umbenannte KI-Chatbot für alle zugänglich, und das in den verschiedensten Sprachen.

Es gibt eine kostenfreie Version und eine Pro-Version, für die man knapp 22€ im Monat investieren muss. Ein ähnliches Konzept also wie bei ChatGPT.

Schlägt Google Bard den KI-Chatbot ChatGPT?
Kann es Google Gemini wirklich mit dem Marktführer aufnehmen?

Ein ernstzunehmender Konkurrent für ChatGPT?

Google Gemini wird als Konkurrenzprodukt für ChatGPT gehandelt. Aber wird es diesem Anspruch auch gerecht? Im direkten Vergleich lassen sich ein paar Unterschiede bei Gemini gegenüber dem Marktführer erkennen.

Anders als sein Konkurrent ChatGPT ist Gemini zum Beispiel in der Lage, Antworten direkt auszugeben. Bei ChatGPT schaut man dem Chatbot quasi dabei zu, wie es den Text Wort für Wort generiert. Google Gemini ist deshalb wesentlich schneller in seinen Antworten als ChatGPT. Beide Tools können mittlerweile auf das Internet zugreifen: Gemini nutzt dazu die Google-Suche, ChatGPT die Suchergebnisse von Bing. Googles Gemini überzeugt zudem mit der Integration der E-Commerce- und Shopping-Plattformen (ChatGPT hat keine direkte Integration), während ChatGPT Multimodalität durch die Integration von Drittanbieter-Schnittstellen ermöglicht.

Die neuere Google KI hat also schnell aufgeholt und kann in vielen Bereichen bereits ChatGPT das Wasser reichen. Vor allem die Integration in andere Google Services ist eine Stärke des Tools. ChatGPT überzeugt im Gegenzug mit größerer Flexibilität und den weitreichenden Möglichkeiten der Bildgeneration. Bei den generierten Texten hat GPT aber weiterhin die Nase vorn und gewinnt in Bezug auf Textlänge, Einzigartigkeit, Umsetzung der Prompts sowie im Bereich der Faktenkorrektheit. Letztere war zu Beginn von Google Gemini sogar ein größeres Problem.

Entwicklung steckt noch in den Kinderschuhen

Der Hype um KI-Systeme nimmt kein Ende. Und genau von diesem Hype wollte auch Google profitieren. Allerdings zeigten sich bei der ersten Präsentation des KI-Chatbots, der das Unternehmen gleich mehrere Milliarden Dollar gekostet haben soll, einige Schwächen: Google Gemini antwortete auf die Frage, was man einem neunjährigen Mädchen über das James Webb Space Telescope erzählen könnte, damit, dass es das erste Foto eines Exoplaneten aufgenommen hätte. Die Antwort von Gemini war allerdings falsch. Das erste Foto wurde bereits 2004 mit dem Very Large Telescope in Chile aufgenommen. Ein Fauxpas, der den Aktienkurs von Google gleich um mehrere Prozent einbrechen ließ.

Der Launch von Google Gemini kam für viele Menschen überraschend – auch für die eigenen Mitarbeiter:innen von Google. Denn diese äußerten kurz vor der Veröffentlichung massive Bedenken. Als „notorischen Lügner“ bezeichnete einer der Google Mitarbeiter:innen das Sprachmodell. Ein:e andere Mitarbeiter:in sprach sogar davon, den Launch des Produktes vollständig zu verschieben, da Gemini nutzlos sei. Google Gemini war schlicht und ergreifend noch nicht reif für die Öffentlichkeit. Doch Google veröffentlichte das System entgegen aller Kritiker:innen. Das lag sicherlich auch daran, dass Google sich im Zugzwang sah. Denn der Wettbewerb für Google auf dem Markt nimmt kontinuierlich weiter zu. Um seine Position zu sichern, musste Google also schnell handeln. Auch nach dem Launch arbeitete Google natürlich weiterhin an den Fähigkeiten von Gemini, sodass die ersten Probleme aus den „Kinderschuhen“ des Programms heute weitestgehend behoben sind.

Google Gemini und die Frage nach der Ethik

Mit dem Aufleben der KI-Systeme ist auch eine wichtige Frage in den Vordergrund gerückt: die Frage nach der Ethik. Zu den wichtigsten ethischen Bedenken gehören folgende Aspekte:

Der Mensch programmiert die Maschine

Systeme wie Google Gemini und ChatGPT werden mit Inhalten trainiert, die in der Regel vom Menschen stammen. Das Problem dabei ist allerdings, dass sich in den Inhalten Vorurteile oder Stereotypen verbergen können. Ob bewusst oder unbewusst – der Maschine werden bestimmte Werte antrainiert, die denen der Entwickler:innen entsprechen. Die reproduzierten Texte der KI-Systeme könnten also teils ethisch fragwürdige Grundlagen aufweisen. Natürlich kann es auch der Fall sein, dass ein Fehler in der Programmierung des Algorithmus vorliegt oder unvollständige Datensätze für das Training der Künstlichen Intelligenz verwendet wurden. So könnte ein Entwicklerteam beispielsweise bei der Programmierung ihrer Systeme Merkmale vergessen, die in ihrer eigenen Gruppe nicht vorkommen. Und genau darin liegt die Gefahr: Die unvollständigen oder fehlerhaften Datensätze der Entwickler:innen verstärken Problematiken wie Diskriminierung und Stigmatisierung bestimmter Gruppen noch mehr. KI-Systeme wie Google Gemini sind deswegen nie ohne Vorurteile. Deswegen ist bei künstlicher Intelligenz auch immer ein kritischer Blick seitens des Menschen gefragt. Denn nur weil ein KI-System etwas sagt, heißt das noch lange nicht, dass es auch der Wahrheit entspricht.

Wie viel Privatsphäre haben wir noch?

KI-Systeme wie Google Gemini sammeln vor allem eines: eine Menge Daten. Nutzer:innen geben täglich die unterschiedlichsten Informationen von sich preis, wenn sie Chatbots wie ChatGPT und Co. verwenden. Doch was genau passiert mit diesen Daten? Eine eindeutige Antwort gibt es bisher nicht auf die Frage. KI-Systeme entwickeln sich auf Grundlage der Daten, die sie erhalten, ständig weiter. Je mehr Daten eine KI bekommt, desto größer ist allerdings auch die Gefahr, dass diese missbraucht werden. Unternehmen könnten sensible Daten an Dritte weiterverkaufen oder diese für weitere Forschungszwecke einsetzen. Besondere Vorsicht ist deshalb geboten, wenn Unternehmen KI-Systeme im Arbeitskontext einsetzen wollen. Hier gilt es, die Datenschutzvorgaben genau zu beachten. In Europa ist der Umgang mit sensiblen Daten beispielsweise durch die DSGVO geregelt. Unklar sieht es hingegen bei der Rechtsgrundlage für die KI-Entwicklung aus. Deswegen arbeitet das Bundesministerium aktuell an einer einheitlichen Regulierung für KI-Entwicklung, die über die Themen des Datenschutzes hinausgeht und ebenso Aspekte wie Diskriminierung, und Quellennachweise abdeckt.

Urheberrecht und künstliche Intelligenz

Google Gemini und ChatGPT wurden dazu entwickelt, Texte zu generieren. Nutzt man nun die von den KI-Systemen generierten Texte, stellt sich unweigerlich die Frage: Wer ist eigentlich Urheber:in der Inhalte? Dabei gilt es zunächst einmal, zwischen dem Input und dem Output der KI zu unterscheiden. Während des Trainings der künstlichen Intelligenz stellt sich bereits die Frage, woher die Informationen kommen. Der Output, den die KI aus ihren antrainierten Datensätzen generiert, wirft wiederum die Frage auf, wem diese Antworten gehören. Zwar ist der Output der KI meist von Nutzer:in zu Nutzer:in individuell und basiert teilweise auf vorangegangenen Anfragen, dennoch müssen sich Nutzer:innen damit auseinandersetzen, ob mit den Texten eventuell Urheberrechtsverletzungen entstehen.

Wer übernimmt die Verantwortung?

KI-Systeme können bei der Entscheidungsfindung helfen. Sie besitzen allerdings keine Werte wie Moral oder Ethik. Sie fällen Entscheidungen auf Basis von zugrundeliegenden Datensätzen und Algorithmen. Das erschwert im Ernstfall natürlich die Frage der Schuldzuweisung, wenn eine KI eine fehlerhafte Entscheidung trifft. Ein prominentes Beispiel dafür ist der Einsatz von künstlicher Intelligenz in autonomen Fahrzeugen. Wenn das autonome Fahrzeug fährt und nun einen Unfall baut, wer trägt dann die Verantwortung? Sind es die Entwickler:innen, die das System fehlerhaft programmiert haben? Ist es die Person, die sich hinter dem Steuer befand? Oder kann sogar eine KI selbst dafür verantwortlich gemacht werden, in der Situation falsch gehandelt zu haben? Menschen müssen sich bei KI-Systemen die Frage stellen, ob sie ihre Verantwortung einfach abgeben können. Denn letztlich stammen die Maschinen immer noch aus der Hand des Menschen. Und somit ist es fragwürdig, ob eine künstliche Intelligenz überhaupt schuldig sein kann, wenn sie als Grundlage für ihre Entscheidungen die Daten der Menschen nutzt.

Fazit

Google Gemini hat seine ersten „Kinderkrankheiten“ weitestgehend abgelegt und kann neben ChatGPT auch einige Vorzüge aufweisen. Gemini wird sich mit der Zeit – wie auch andere KI-Systeme – noch weiter entwickeln und weiter lernen. Das Feedback der Nutzer:innen kann dabei helfen, das Sprachmodell weiter zu optimieren. Und das ist auch notwendig, wenn man bedenkt, welche Lücken KI-Systeme aktuell noch in Bezug auf ethische Grundsätze aufweisen. Fest steht aber schon jetzt: Google Gemini wird seinen Platz in der Welt der KI-Systeme finden.

Previous Das war der MultichannelDay 2024
Next KI und Ethik

No Comment

Leave a reply

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

vierzehn − 3 =