Home » Claude 2 ist da – wie schneidet der KI-Chatbot von Anthropic im Vergleich zu ChatGPT und Google Bard ab?

Claude 2 ist da – wie schneidet der KI-Chatbot von Anthropic im Vergleich zu ChatGPT und Google Bard ab?

by Patricia

Die von ehemaligen OpenAI-Forschern gegründete KI-Firma Anthropic hat ihren aktualisierten Chatbot Claude 2 vorgestellt, der es mit Konkurrenten wie ChatGPT und Google Bard aufnehmen soll.

Der Nachfolger von Claude, der nur fünf Monate nach seinem Debüt auf den Markt kam, zeichnet sich durch längere Antworten, differenziertes Denken und eine überragende Leistung aus, mit der er in den GRE-Prüfungen zum Lesen und Schreiben beeindruckende Ergebnisse erzielte.

Claude 2 wird als KI-Kraftpaket bezeichnet, das in der Lage ist, bis zu 100.000 Token, was ungefähr 75.000 Wörtern entspricht, in einer einzigen Aufforderung zu verarbeiten. Dies ist ein dramatischer Sprung von Claudes vorheriger 9.000-Token-Grenze, die einen einzigartigen Vorteil bietet: die Fähigkeit der KI, Antworten in einer kontextuelleren und verbesserten Weise zu geben.

Das neue Modell hat in mehreren Bereichen, darunter Recht, Mathematik und Codierung, erhebliche Fortschritte gemacht, die in standardisierten Tests bewertet wurden. Nach Angaben von Anthropic erzielte Claude 2 im Multiple-Choice-Teil der Anwaltsprüfung 76,5 % (GPT-3.5 erreichte 50,3 %) und erreichte in den Lese- und Schreibprüfungen des GRE eine höhere Punktzahl als 90 % der Bewerber für eine Graduiertenschule. Claude 2 erzielte außerdem 71,2 % beim Codex HumanEval Python-Codierungstest und 88,0 % bei den GSM8k-Matheaufgaben für Grundschüler, was seine fortgeschrittenen Rechenfähigkeiten verdeutlicht.

Wie TCN berichtet, verfügt Anthropic’s Claude über eine einzigartige „Verfassung“, eine Reihe von Regeln, die von der Allgemeinen Erklärung der Menschenrechte inspiriert sind und die es ihm ermöglichen, sich ohne menschliches Feedback selbst zu verbessern, unangemessenes Verhalten zu erkennen und sein eigenes Verhalten anzupassen.

Aber wie schlägt es sich im Vergleich zu den beiden Monarchen des Hügels, ChatGPT und Googles neuem Bard? Beginnen wir damit, wie gut sie bei den technischen Daten abschneiden.

Preis:

  • ChatGPT: Kostenlos für diejenigen, die die Version GPT-3.5 verwenden. Diejenigen, die die leistungsfähigere Version mit GPT-4 verwenden möchten, müssen $20 pro Monat für die ChatGPT Plus-Version bezahlen.
  • Claude: Kostenlos
  • Bard: Frei

Verfügbarkeit:

  • ChatGPT: Ist die am weitesten verbreitete der drei Varianten.
  • Bard: Ist in weniger Ländern verfügbar als ChatGPT.
  • Claude: Vorübergehend in den USA und Großbritannien verfügbar.

Datenschutz:

  • ChatGPT: Ermöglicht Benutzern das Löschen ihrer Interaktionen. Unterstützt nicht das Surfen über VPN.
  • Bard: Hat eine Option zum automatischen Löschen von Interaktionen nach 18 Monaten. Lässt die Benutzer nicht auf frühere Interaktionen zugreifen. Unterstützt VPNs, wodurch es praktisch in jedem Teil der Welt verfügbar ist und politische Beschränkungen umgangen werden können.
  • Claude: Erlaubt den Nutzern, ihre Unterhaltungen zu löschen. Unterstützt VPN-Browsing.

Unterstützte Sprachen:

  • ChatGPT: Unterstützt über 80 Sprachen.
  • Bard: Unterstützt Englisch, Japanisch und Koreanisch.
  • Claude: Unterstützt mehrere weit verbreitete Sprachen wie Englisch, Spanisch, Portugiesisch, Französisch, Mandarin und Deutsch, neben anderen. Wenn es eine Sprache nicht erkennt (oder die Eingabe viele Grammatikfehler enthält), liefert es eine einleitende Phrase und antwortet dann auf Englisch.

Kontextbehandlung:

  • ChatGPT: Die kostenlose Version unterstützt 7.096 Kontext-Token, ChatGPT Plus (GPT-4) unterstützt 8.192 Token. OpenAI bietet eine Version an, die 32K Token unterstützt, aber sie wird von ChatGPT nicht verwendet.
  • Bard: Unterstützt 8.196 Token an Kontext.
  • Claude: Unterstützt 100.000 Token an Kontext – kein Tippfehler.

Funktionen:

  • ChatGPT: Die kostenlose Version hat keine zusätzlichen Funktionen. GPT Plus bietet einen Plugin-Speicher, einen Code-Interpreter und eine vorübergehend pausierte Web-Browsing-Funktion, die von Microsoft Bing unterstützt wird. Bietet API-Unterstützung.
  • Bard: Der Chatbot befindet sich noch in der Experimentierphase, wird aber über einen Plugin-Store und eine Google Suite-Integration verfügen. Bietet begrenzten Zugang zu seiner API.
  • Claude: Der Chatbot kann zu Slack hinzugefügt werden und verschiedene Aufgaben übernehmen, wie z. B. Threads zusammenfassen, Vorschläge machen, Brainstorming usw. Bietet API-Unterstützung.

Der Kampf der Prompts: ChatGPT gegen Bard gegen Claude

TCN hat dieselbe Eingabeaufforderung verwendet, um die von den drei Chatbots erzielten Ergebnisse zu vergleichen

Fremdsprachenverstehen

Zunächst fragten wir nach der Bedeutung einer gebräuchlichen spanischen Slangphrase. Claude erwies sich bei seiner Erklärung als vorsichtiger und genauer, ChatGPT lieferte eine ausreichende Erklärung, aber Bard verweigerte die Antwort mit dem Argument, dass es kein Spanisch sprechen könne. Als wir jedoch unsere Aufforderung von „was bedeutet das“ in „was ist das englische Äquivalent zu“ umformulierten, gab es eine bessere Antwort als die von ChatGPT, wenn auch weniger ausführlich als die von Claude AI.

Antwort von Claude 2.

Antwort von Claude 2.


Antwort von ChatGPT.

Antwort von ChatGPT.


Antwort bereitgestellt von Google Bard.

Antwort bereitgestellt von Google Bard.

Aktuelle Informationen

Dann haben wir die Modelle nach dem heutigen Bitcoin-Kurs gefragt. Damit werden nicht nur die Web-Browsing-Funktionen getestet, sondern es wird auch gemessen, wie viele Informationen jedes Modell auf der Grundlage einer einzigen Bestellung liefert.

ChatGPT ist fehlgeschlagen. Er ist nicht mit dem Internet verbunden und kann daher keine aktuellen Informationen liefern. Auch Claude hat keine Internetverbindung. Im Gegensatz zu ChatGPT halluzinierte er jedoch eine Antwort mit falschen Informationen. Würde ein Nutzer eine Frage stellen, in der Annahme, dass Claude eine Internetverbindung hat, würde er eine falsche Antwort erhalten, die als richtig erscheint. Google Bard lieferte die richtigen Informationen:

Antwort bereitgestellt von ChatGPT.

Antwort bereitgestellt von ChatGPT.


Antwort von Claude 2.

Antwort von Claude 2.


Antwort von Google Bard.

Antwort von Google Bard.

Kontextbehandlung

Als Nächstes haben wir die Modelle auf ihre Fähigkeit getestet, große Textmengen zu verarbeiten. Wir nahmen die Bibel als Beispiel und kopierten den gesamten Text von Genesis 1:1 bis Exodus 25:39 (fast 62.000 Wörter). Dann stellten wir eine sehr spezifische Frage zu der im Text enthaltenen Geschichte.

Das einzige Modell, das eine Antwort geben konnte, war wie erwartet Claude. Er brauchte etwa 2 Minuten, um die Frage zu bearbeiten, gab aber eine genaue Antwort. Wir haben spezielle Markierungen verwendet, um sicherzustellen, dass es nicht schummelt und tatsächlich den Text analysiert, und es war der Aufgabe gewachsen.

Antwort von Claude 2.

Antwort von Claude 2.

Nonverbale Fähigkeiten

Schließlich haben wir die Modelle gebeten, einige mathematische Aufgaben zu lösen. KI-LLMs sind dafür nicht wirklich ausgelegt, und ChatGPT Plus mit GPT-4 ist mit seinem Code-Interpreter wahrscheinlich die beste Option unter den dreien. Dennoch haben wir die drei Modelle getestet und sie gebeten, einen Zahlungsplan für eine Person zu erstellen, die versucht, ihre Kreditkartenschulden zu begleichen. Wir baten die Modelle auch zu bewerten, welche Karten verwendet und welche vermieden werden sollten.

Claude lieferte die umfassendsten Antworten in Bezug auf den Plan. Allerdings machte es einen Fehler und empfahl uns, die Ausgaben für die Karte mit dem höchsten effektiven Jahreszins zu bevorzugen.

Antwort von Claude 2.

Antwort von Claude 2.


ChatGPTs Code-Interpreter hat eine Antwort geliefert, bei der wir eine der Karten überbezahlen, was nicht wirklich sinnvoll ist, wenn jemand Schulden auf anderen Karten hat.

Reply provided by ChatGPT using code interpreter.

Reply provided by ChatGPT using code interpreter.


GPT 3.5 lieferte keine genauen Ergebnisse und forderte uns auf, mehr Geld zu zahlen, als wir tatsächlich zur Verfügung hatten.

Reply provided by ChatGPT.

Reply provided by ChatGPT.


Bard war recht allgemein gehalten. Er ging auf Nummer sicher und nannte keine Zahlen, sondern beschrieb im Wesentlichen die so genannte Debt-Avalanche-Methode

Reply provided by Google Bard.

Reply provided by Google Bard.

Stärken und Schwächen

Claude 2:

  • Stärken: Claude 2 hat eine beeindruckende Fähigkeit, große Kontexte mit bis zu 100.000 Token zu verarbeiten. Er zeigt überragende Leistungen in verschiedenen Bereichen wie Recht, Mathematik und Codierung und erzielt in standardisierten Tests hohe Punktzahlen. Er kann sich selbst verbessern und ohne menschliches Feedback anpassen und unterstützt VPN-Browsing. Der Chatbot kann auch zu Slack hinzugefügt werden, um Aufgaben zu bearbeiten, und bietet API-Unterstützung.
  • Schwächen: Er ist vorübergehend nur in den USA und Großbritannien verfügbar. Claude 2 verfügt nicht über eine Internetverbindung und kann falsche Informationen liefern, wenn es um aktuelle Daten aus der realen Welt geht. Er kann bei komplexen Aufgaben Fehler machen und dabei sehr überzeugend klingen.

ChatGPT:

  • Stärken: ChatGPT ist das am weitesten verbreitete der drei Modelle und unterstützt über 80 Sprachen. Die ChatGPT Plus-Version bietet außerdem API-Unterstützung und einen Plugin-Store.
  • Schwächen: Im Vergleich zu Claude 2 sind die Möglichkeiten der Kontextverarbeitung begrenzt. Die kostenlose Version bietet keine zusätzlichen Funktionen und ist viel eingeschränkter und von geringerer Qualität als die kostenpflichtige Version. Die Web-Browsing-Funktion wird vorübergehend angehalten und kann keine Echtzeitdaten liefern. Bei einigen komplexen Aufgaben kann sie unangemessene Ergebnisse liefern.

Google’s Bard:

P

  • Stärken: Bard unterstützt VPN-Browsing. Es kann aufgrund seiner Internetverbindung Daten in Echtzeit liefern. Bard plant außerdem die Integration mit Google Suite und bietet einen Plugin-Store.
  • Schwächen: Bard unterstützt weniger Sprachen als ChatGPT. Sein API-Zugang ist begrenzt, und seine Fähigkeiten zur Kontextverarbeitung sind geringer als die von Claude 2. Die Antworten von Bard können generisch und bei einigen komplexen Aufgaben wenig hilfreich sein – ein vernünftiger Kompromiss, wenn der Benutzer das Risiko von Halluzinationen verringern möchte.
  • Schlussfolgerung

    Nun, da der Bereich der KI-LLMs und Chatbots mehr Möglichkeiten bietet, muss man nicht unbedingt ein ChatGPT-Fanboy werden oder sich in das reine Google-Lager begeben.

    Wenn Sie zögern, $20 für ChatGPT Plus zu bezahlen, sollten Sie Claude in Betracht ziehen. Es bietet eine vergleichbare Funktionalität wie GPT-4 und wird wahrscheinlich bessere Ergebnisse liefern als GPT-3.5, die Version, die im kostenlosen ChatGPT verfügbar ist – und es wird für die meisten Nutzer eine bessere Wahl sein als Google Bard. Ein zusätzliches Merkmal von Claude ist seine Fähigkeit, PDFs und Dateien mit vielen Erweiterungen zu analysieren. Sie können die Dateien einfach per Drag & Drop in das Programm ziehen, ähnlich wie bei den kostenpflichtigen Plugins, die im GPT Plus-Abonnement verfügbar sind. Bevor Sie sich also entscheiden, für ChatGPT 4 zu bezahlen, sollten Sie Claude vielleicht einmal ausprobieren. Damit können Sie möglicherweise etwas Geld sparen.

    Jede Option hat jedoch Stärken und Schwächen, die jeden Bot für bestimmte Anforderungen attraktiver machen. Claude verarbeitet große Datenmengen, ist aber möglicherweise nicht die beste Wahl für Aufgaben, die Echtzeitdaten erfordern. ChatGPT ist kreativer und eignet sich perfekt für Aufgaben, die eine spezielle Sprachunterstützung erfordern (und sein Plugin-Store ist wirklich gut, wenn Sie bereit sind, den Preis zu zahlen). Bard hingegen ist sachlicher, genauer und nutzt seine Internetverbindung, ist aber vielleicht nicht die beste Lösung für kreative Aufgaben.

    Warum sollten Sie sich für eines entscheiden? Sie brauchen sich nicht zu entscheiden, welches Programm besser ist – Sie können sie alle verwenden.

    Related Posts

    Leave a Comment