ChatGPT vs. Google Gemini - Welche KI ist besser?

Vorschau

Diesen Monat (Februar 2024) stellte Google seinen neuesten Versuch vor, ChatGPT von seiner Position als König der generativen KI-Chatbots zu verdrängen, die es seit seiner Einführung im November 2022 innehat.

Google Gemini und ChatGPT

Google Bard - jetzt umbenannt in Google Gemini - wurde Anfang 2023 nach der bahnbrechenden Demonstration der Fähigkeiten von OpenAI’s ChatGPT veröffentlicht. Und um ehrlich zu sein, schien es seitdem so, als ob Google die ganze Zeit probiert hat, aufzuholen.

Dank der Integration in die Google-Suche konnte Gemini (aka Bard) jedoch vom ersten Tag an auf das Internet mit Echtzeitinformationen zugreifen. Die ersten Versionen von ChatGPT hingegen waren auf das Wissen beschränkt, das der KI während des Trainings beigebracht worden war.

OpenAI erweiterte ChatGPT jedoch bald um neuere Daten und der Möglichkeit, über eine Anbindung an Microsofts Suchmaschine Bing auf externe Informationen zuzugreifen. Abgesehen von der Suche war man sich immer einig, dass ChatGPT für ein breiteres Spektrum von Tätigkeiten einfach nützlicher ist.

Jetzt zieht Google alle Karten, benennt das Sprachmodell, das hinter den Kulissen die Arbeit erledigt, in Gemini um und ermöglicht den Zugang zu seinem erweiterten Premium-Dienst Gemini Pro über ein Abonnement (Google One AI), das preislich mit ChatGPT konkurriert (20 $ / Monat).

Ist Google nun also bereit, in den Ring zu steigen und den unbestrittenen Champion herauszufordern? Im Folgenden werde ich einen Überblick über die beiden Plattformen geben und die Unterschiede hervorheben, die man kennen sollte, wenn man sich für eine der beiden Plattformen entscheiden möchte.

Die Sprachmodelle

deep learning

Zuerst sollte erwähnt werden, dass sowohl Gemini als auch ChatGPT auf unglaublich umfangreichen großen Sprachmodellen (LLMs) basieren, die weitaus fortschrittlicher sind als alles, was in der nahen Vergangenheit verfügbar war.

Bedenke dabei, dass ChatGPT nur die Schnittstelle oder Oberfläche ist, über die Benutzer mit dem zugrundeliegenden Sprachmodell kommunizieren - GPT-4 bei zahlende Benutzenden mit ChatGPT Plus oder GPT-3.5 bei allen kostenlosen Nutzenden.

Im Fall von Google heißt die Schnittstelle Gemini (früher Bard) und wird für die Kommunikation mit dem Sprachmodell verwendet, das eine separate Einheit ist, aber auch Gemini genannt wird.

Es ist wichtig zu wissen, dass, obwohl wir beide als Chatbots bezeichnen, die beabsichtigte Benutzererfahrung leicht unterschiedlich ist. ChatGPT wurde entwickelt, um Unterhaltungen zu ermöglichen und bei der Lösung von Problemen in einer gesprächsähnlichen Art und Weise zu helfen - ähnlich einem Chat mit einem Experten zu einem bestimmten Thema.

Gemini hingegen scheint darauf ausgelegt zu sein, Informationen zu verarbeiten und Aufgaben zu automatisieren, um dem Benutzer Zeit und Mühe zu ersparen.

Aus technischer Sicht wird die Leistung von LLM-Modellen häufig an der Anzahl der Parameter (trainierbare Werte) innerhalb des neuronalen Netzes gemessen. Es wurde berichtet, dass die GPT-4-Netze etwa eine Billion Parameter enthalten. Es gibt jedoch keine verlässlichen Daten über die Anzahl der von Gemini verwendeten Parameter.

🏆Und der Gewinner ist...

ChatGPT. Die Benutzerfläche von ChatGPT ist deutlich ausgereifter und die Fähigkeit, durch GPTs ein kleines eigenes Sprachmodell zu entwicklen ist ungeschlagen. Lediglich bei dem Echtzeitzugriff auf Informationen hat Google die Nase vorne.

Informationsbeschaffung

informationsbeschaffung-digital

Ein Vorteil von Gemini ist, dass es standardmäßig alle Informationen berücksichtigt, die ihm zur Verfügung stehen - einschließlich des Internets, des riesigen Wissensgraphen von Google und seiner Trainingsdaten.

ChatGPT hingegen wird oft versuchen, eine Frage nur auf Basis seiner Trainingsdaten zu beantworten. Dies kann manchmal zu veralteten Informationen führen. Man kann dies zwar auch umgehen, indem man ChatGPT anweist, im Internet nach den neuesten und aktuellsten Daten zu suchen. Dies ist aber ein zusätzlicher Schritt, der bei Gemini nicht notwendig ist.

Nach meiner Erfahrung mit beiden Plattformen muss ich sagen, dass Gemini etwas geschickter ist als ChatGPT, wenn es darum geht, online zu suchen und die gefundenen Informationen in seine Antworten zu integrieren.

Wenn ChatGPT online nach Informationen sucht, verlieren seine Antworten deutlich an Dynamik und Qualität. Es hat auch oft den Anschein, als würde es Fragen beantworten oder Antworten geben, die auf einer einzigen Websuche und einer einzigen Informationsquelle basieren, anstatt eine umfassende Analyse aller ihm zugänglichen Informationen durchzuführen und zu einer Schlussfolgerung zu gelangen.

Hier ein kurzes Beispiel, was das bedeutet. Ich verwende häufig KI-Chatbots, um mir einen schnellen Überblick über ein Unternehmen, seine Produkte oder Dienstleistungen zu verschaffen. Mit der gleichen Aufforderung ("Erzähle mir etwas über [Unternehmen]") gibt ChatGPT oft einfach einen Marketingtext von der Website wieder.

Währenddessen scheint Gemini einen differenzierteren Ansatz zu verfolgen. Es fasst die Informationen zusammen, die es finden kann, und versucht, einen ausgewogenen Überblick über die Funktionen zu geben.

Ich würde daher sagen, dass Gemini seinem Konkurrenten von OpenAI in diesem Bereich voraus ist.

Aber das ist leider noch nicht die ganze Geschichte. Wenn es darum geht, die Informationen, auf denen das LLM trainiert wurde, intelligent zu analysieren, um eine qualitativ hochwertige Antwort zu formulieren, ist ChatGPT immer noch der Sieger.

🏆Und der Gewinner ist...

Nennen wir es ein Unentschieden: Gemini ist besser, wenn es darum geht, Antworten aus Online-Texten zu formulieren, und ChatGPT ist besser, wenn es darum geht, Antworten ohne Internetdaten zu formulieren.

Multimodale Fähigkeiten

gpt4 prozessor

Multimodale KIs sind solche, die mehr als eine Art von Daten verarbeiten können. Frühe Versionen von ChatGPT haben nur Text gelesen und generiert. Aber seit OpenAI auf GPT-4 aufgerüstet hat, ist es in der Lage, visuelle und akustische Daten zu verarbeiten, was es multimodal macht. Gemini hingegen war von Anfang an multimodal (auch wenn nicht alle Funktionen sofort aktiviert waren).

ChatGPT erzeugt Bilder mit dem DALL-E-3-Modell, das ebenfalls von OpenAI entwickelt wurde. Gemini hingegen verwendet die Imagen 2 Engine von Google. Beide sind eindeutig sehr leistungsfähig und können erstaunliche Ergebnisse liefern. Ich würde jedoch sagen, dass ChatGPT konsistenter ist, wenn es darum geht, ein Bild zu erzeugen, das genau dem entspricht, was ich gefordert habe, wenn man die beiden KIs auf der Grundlage der gleichen Prompts vergleicht.

Ein Unterschied, der von vielen angemerkt wurde, ist, dass Imagen 2 und Gemini etwas besser darin sind, fotorealistische, sehr detaillierte Bilder zu erzeugen. ChatGPT hingegen zeichnet sich durch seine Fähigkeit aus, räumliche Beziehungen zwischen Objekten in seinen Bildern besser darzustellen und Prompts kreativer zu interpretieren.

Beide sind auch in der Lage, Programmiercode in einer Vielzahl von Programmiersprachen zu verstehen und zu schreiben. Es gibt jedoch leichte Unterschiede in der Art und Weise, wie sie dies tun. Aus meiner Erfahrung schlägt sich bei anspruchsvolleren Aufgaben ChatGPT Plus deutlich besser. ChatGPT ist außerdem besser darin, klare und hilfreiche Anweisungen zum Code zu geben und Vorschläge und Tipps zu liefern. Wenn man nur die kostenlosen Versionen vergleicht, so hat Google mit Gemini eindeutig die Nase vorn.

🏆Und der Gewinner ist...

Der Sieg dieser Kategorie geht an ChatGPT. Gemini erzeugt bessere fotorealistische Bilder, aber ChatGPT gewinnt, wenn es darum geht, Bilder zu erzeugen, die genau dem entsprechen, was der Benutzer mit seiner Eingabe erreichen will. Gemini scheint aufgeholt zu haben, wenn es darum geht, technischen Code zu erzeugen, kann aber immer noch nicht mit ChatGPT mithalten, wenn es darum geht, über Quellcode zu schreiben und Tipps zu geben.

Sollte man bei keinem der Chatbots die Premium-Version kaufen wollen, geht der Sieg an Google Gemini.

Welcher KI-Chatbot ist nun also besser?

OpenAI Schriftzug auf Handy

Nun, weder der eine noch der andere ist perfekt. Beide leiden immer noch unter Halluzinationen und liefern oft genug Informationen, die schlichtweg falsch sind. Gemini sagte mir zum Beispiel, dass Dall-E von OpenAI auf keinem Diffusionsmodell basiert (das tut es). Und ChatGPT sagte mir, dass Gemini keine Bilder erzeugen kann (das tut es).

Aber wenn man für ein Abonnement zahlen möchte, würde ich im Moment immer noch zu ChatGPT Plus greifen.

Für das Schreiben und Erstellen von Dokumenten, Zusammenfassungen, allgemeine Bilderzeugung und Lernen durch und mit künstlicher Intelligenz ist ChatGPT meiner Meinung nach momentan einfach noch besser geeignet. Aus diesem Grund bleibt es das Beste, was derzeit verfügbar ist. Mit Integrationen in Google Docs und Gmail bietet Google mittlerweile jedoch auch eine Alternative, die einen genaueren Blick wert ist.

Wenn man hingegen für kein Abonnement zahlen möchte, so ist das Gratismodell von Gemini zurzeit deutlich leistungsfähiger als GPT-3, die Gratisversion von ChatGPT.

Nutzt du ChatGPT oder Google Gemini lieber?


Häufig gestellte Fragen zum Thema

  • Google Gemini, ursprünglich als Bard bekannt, ist Googles Antwort auf OpenAIs ChatGPT. Während beide auf großen Sprachmodellen basieren, zielt Gemini darauf ab, Informationen zu verarbeiten und Aufgaben zu automatisieren, mit direktem Zugriff auf das Internet für Echtzeitinformationen. ChatGPT hingegen fokussiert sich auf Unterhaltungen und Problemlösungen in einer gesprächsähnlichen Weise. Google Gemini bietet auch einen Premium-Dienst namens Gemini Pro an.

  • Google Gemini hat den Vorteil der direkten Integration in die Google-Suche, was es ihm ermöglicht, auf Echtzeitinformationen aus dem Internet zuzugreifen. Dies bedeutet, dass Gemini potenziell aktuellere Antworten als ChatGPT bieten kann, das zunächst auf sein Trainingswissen beschränkt war, bis es durch Bing für den Zugang zu externen Informationen erweitert wurde.

  • Gemini Pro ist über ein Abonnementmodell verfügbar, das mit ChatGPT Plus konkurriert und 20 $ pro Monat kostet. Dies bietet Nutzern erweiterte Funktionen und Zugänge, ähnlich dem Premium-Service, den OpenAI mit ChatGPT Plus anbietet.

  • ChatGPT und Google Gemini sind beide in der Lage, neben Text auch visuelle und akustische Daten zu verarbeiten, was sie zu multimodalen KI-Systemen macht. ChatGPT nutzt hierfür das DALL-E-3-Modell von OpenAI, während Gemini die Imagen 2 Engine von Google verwendet. Beide können beeindruckende visuelle Inhalte erzeugen, aber ChatGPT wird eine konsistentere Leistung bei der Umsetzung spezifischer Benutzeranfragen zugeschrieben.

  • Ja, beide KI-Chatbots sind in der Lage, Programmiercode in verschiedenen Sprachen zu verstehen und zu schreiben. Es gibt jedoch Nuancen in ihrer Effektivität, wobei ChatGPT Plus bei komplexeren Aufgaben und in der Bereitstellung klarer Anweisungen und Tipps besser abschneidet. Google Gemini bietet in seiner kostenlosen Version einen starken Konkurrenten, besonders bei der Erstellung technischen Codes.

  • Obwohl beide KI-Chatbots erstaunliche visuelle Inhalte erzeugen können, neigt ChatGPT dazu, besser darin zu sein, Bilder zu generieren, die genau den Anforderungen des Benutzers entsprechen. Dies liegt an seiner Fähigkeit, räumliche Beziehungen zwischen Objekten besser darzustellen und Prompts kreativer zu interpretieren. Du findest eine Übersicht über die besten Bilder-KI-Generatoren hier.

  • Wenn man kein Abonnement abschließen möchte, bietet das kostenlose Modell von Google Gemini aktuell mehr Leistung als die Gratisversion von ChatGPT (GPT-3). Gemini ist somit für Nutzer ohne Abonnementwunsch die leistungsfähigere Option.

  • Für Aufgaben wie das Schreiben und Erstellen von Dokumenten, Zusammenfassungen und allgemeine Bilderzeugung empfiehlt sich ChatGPT, besonders in seiner Plus-Version. ChatGPT bietet eine ausgereiftere Benutzererfahrung und eine bessere Eignung für Lernen und kreative Anwendungen.

Zurück
Zurück

ChatGPT rollt Vorlesen-Funktion aus

Weiter
Weiter

GPT-4 Turbo vs. GPT-4: Was ist der Unterschied zwischen OpenAI’s Sprachmodellen?