元OpenAIの研究者が立ち上げたAI会社Anthropicは、ChatGPTやGoogle Bardのようなライバルに照準を合わせ、アップデートされたチャットボットClaude 2を発表した。
クロードのデビューからわずか5ヶ月で登場した後継機は、より長い応答、ニュアンスに富んだ推論、優れたパフォーマンスを誇り、GREのリーディングとライティングの試験で印象的なスコアを獲得した。
クロード2は、1回のプロンプトで最大10万トークン(7万5千語にほぼ相当)を消化できるAIの強者である。これは、クロードの以前の9,000トークンの制限から劇的な飛躍であり、AIがより文脈的で改善された方法で回答を提供する能力というユニークな利点を示している。
新モデルは、標準化されたテストによって評価された法律、数学、コーディングなど複数の分野で大きな進歩を遂げた。Anthropic社によると、クロード2は司法試験の多肢選択式セクションで76.5%(GPT-3.5は50.3%)を獲得し、GREのリーディングとライティング試験では大学院受験者の90%以上のスコアを達成した。クロード2はまた、Codex HumanEval Pythonコーディングテストで71.2%、GSM8k小学生向け算数問題で88.0%を獲得し、その高度な計算能力を明らかにした。
TCNが報じたように、Anthropicのクロードは、世界人権宣言にインスパイアされた一連のルールである独自の「憲法」で設計されており、人間のフィードバックなしに自己改善し、不適切な行動を特定し、自らの行動を適応させることができる。
しかし、ChatGPTとGoogleの新しいBardという2つの君主と比較するとどうなのだろうか?まずはスペックから見てみよう。
価格:
- (ユーブイエックスダブリューピー
- ChatGPT: GPT-3.5をお使いの方は無料です。GPT-4より強力なバージョンを使用したい場合は、ChatGPT Plusバージョンに月額20ドルを支払う必要があります。
- クロード: 無料
- Bard: 無料
アベイラビリティ:
- ChatGPT:3つの中で最も広く利用可能。
- Bard:ChatGPTより利用可能な国が少ない。
- Claude: 一時的にアメリカとイギリスで利用可能。
。
プライバシー:
- ChatGPT: ユーザーとのやりとりを削除できます。VPN経由での閲覧はサポートしていません。
- Bard:18ヶ月後にやりとりを自動削除するオプションがあります。過去のやりとりを取り戻すことはできない。VPNをサポートしているため、政治的な制限を回避し、世界のどの地域でも事実上利用可能。
- Claude: ユーザーが会話を削除できる。VPNブラウジングをサポート。
。
サポート言語:
- ChatGPT: 80以上の言語をサポート。
- Bard:英語、日本語、韓国語をサポート。
- Claude:英語、スペイン語、ポルトガル語、フランス語、北京語、ドイツ語など、広く普及している言語をサポートしています。言語を認識できない場合(または入力に多くの文法エラーがある場合)、導入フレーズを提供し、その後英語で回答します。
コンテキスト処理:
- ChatGPT: 無料版は7,096トークンのコンテキストをサポートし、ChatGPT Plus (GPT-4)は8,192トークンをサポートしています。OpenAIは32Kトークンをサポートするバージョンを提供していますが、ChatGPTでは使用されません。
- Bard: 8,196トークンのコンテキストをサポート。
- Claude: 100,000トークンのコンテキストをサポートします。
。
特徴:
- ChatGPT: 無料版には追加機能はありません。GPT Plusは、プラグインストア、コードインタープリタ、Microsoft Bingによる一時停止ウェブブラウジング機能を提供します。APIサポートを提供します。
- Bard: チャットボットはまだ実験段階ですが、プラグインストアとGoogle Suiteの統合があります。APIへのアクセスは制限されています。
- Claude:このチャットボットはSlackに追加することができ、スレッドの要約、提案、ブレーンストーミングなどの様々なタスクを処理する。APIサポートを提供します。
。
プロンプトの戦い: ChatGPT対Bard対Claude
。
TCNは同じプロンプトを使って、3つのチャットボットの結果を比較しました
。
外国語の理解
まず、一般的なスペイン語の俗語の意味を尋ねた。クロードはより慎重で正確な説明であることを証明し、ChatGPTは十分な説明をしたが、バルドはスペイン語を話すことができないと主張して返事を拒否した。しかし、”これはどういう意味ですか “というプロンプトを “英語では何に相当しますか “というプロンプトに言い換えると、クロードAIの回答よりは少ないものの、ChatGPTの回答よりも良い回答を返しました。
最新情報
。
次に、モデルたちに今日のビットコインの価格を聞いてみた。これはウェブ閲覧機能をテストするだけでなく、1回の注文をもとにそれぞれがどれだけの情報を提供するかも測っている。
ChatGPTは失敗しました。インターネットに接続していないので、最新の情報を提供できない。クロードもインターネットに接続していない。しかし、ChatGPTと違って、間違った情報で答えを幻覚してしまいます。もしユーザーがクロードがインターネットに接続していると仮定して何かを尋ねると、正しいように見える間違った答えが返ってくるでしょう。グーグル・バードは正しい情報を提供した。
コンテキストの処理
次に、大きなテキストの塊を扱う能力について、モデルをテストした。例として聖書を使い、創世記1:1から出エジプト記25:39までのすべてのテキスト(ほぼ62Kワード)をコピーした。そして、そのテキストに書かれているストーリーから非常に具体的な質問をした。
答えを出すことができたのは、予想通りクロードだけだった。クロードはプロンプトを処理するのに2分ほどかかったが、正確な答えを返した。私たちは、このモデルが不正行為をしておらず、実際にテキストを分析していることを確認するために特定のマーカーを使用しました。
非言語能力
最後に、いくつかの数学タスクを処理するようモデルに求めた。GPT-4搭載のChatGPT Plusは、コード・インタプリタを搭載しており、3つのモデルの中ではおそらく最良の選択肢でしょう。しかし、我々は3つのモデルをテストし、クレジットカードの借金を整理しようとしている人のための支払い計画を作成するように依頼しました。また、どのカードを使い、どのカードを避けるべきかをランク付けしてもらった。
クロードは、プランに関して最も包括的な回答を提供した。しかし、それは間違いを犯し、APRが最も高いカードでの支出を優先するよう勧めた。
ChatGPTのコード・インタプリタは、カードの1枚に過払い金を支払うという回答を提供しましたが、これは他のカードに借金がある場合、あまり役に立ちません
。
GPT 3.5は正確な結果を提供せず、実際に利用可能な金額以上の支払いを要求してきました。
バードは非常に一般的でした。基本的に負債雪崩方式として知られているものを説明しています。
長所と短所
クロード2:
- 長所:クロード2は、10万トークンまでの大規模なコンテキストを処理する素晴らしい能力を持っている。法律、数学、コーディングなど様々な分野で優れた能力を発揮し、標準化されたテストでは高得点を誇る。人間のフィードバックなしに自己改善や適応が可能で、VPNブラウジングにも対応している。このチャットボットはSlackに追加してタスクを処理することも可能で、APIもサポートしている。
- Weaknesses: 一時的に米国と英国でのみ利用可能。Claude 2にはインターネット接続がないため、現在の実世界のデータについて質問された場合、誤った情報を提供する可能性がある。複雑なタスクでミスを犯すことがあり、またそのことについて非常に説得力があるように聞こえる。
。
チャットGPT:
- 強み: ChatGPTは3つのモデルの中で最も広く利用可能で、80以上の言語をサポートしています。また、APIサポートとプラグインストアをChatGPT Plusバージョンで提供しています。
- Weaknesses: クロード2に比べ、コンテキスト処理機能が制限されています。無料版は追加機能を提供せず、有料版よりはるかに制限され、品質も劣ります。ウェブ閲覧機能は一時的に停止され、リアルタイムのデータを提供できない。一部の複雑なタスクでは、不適切な結果を生成することがあります。
Googleのバード:
- 長所:BardはVPNブラウジングをサポートしている。インターネットに接続しているため、リアルタイムのデータを提供できる。また、Google Suiteと統合し、プラグインストアを提供する予定。
- Weaknesses: BardはChatGPTよりサポートする言語が少ない。APIアクセスは制限され、コンテキスト処理能力はクロード2より劣ります。Bardの応答は一般的で、複雑なタスクでは役に立たないことがあります-ユーザーが幻覚のリスクを減らしたいのであれば、これは妥当な妥協点です。
結論
現在、AI LLMとチャットボットの分野にはより多くの選択肢があり、必ずしもChatGPTのファンボーイになったり、グーグルのみの陣営に入ったりする必要はない。
もしChatGPT Plusに20ドル払うことに躊躇しているのであれば、Claudeを使うことを検討しよう。GPT-4と同等の機能を提供し、GPT-3.5よりも優れた出力を生成します。Claudeの追加機能はPDFと多くの拡張子のファイルを分析する能力です。GPT Plusサブスクリプションで利用可能な有料プラグインと同様に、ファイルをプログラムにドラッグ&ドロップするだけです。ChatGPT 4 を購入する前に、Claude を試してみてはいかがでしょうか。お金を節約できる可能性があります。
しかし、それぞれのオプションには長所と短所があり、特定のニーズに対してそれぞれのボットをより魅力的にしています。クロードは大量のデータを処理しますが、リアルタイムのデータを必要とするタスクには最適ではないかもしれません。ChatGPTはより創造的で、特定の言語サポートが必要なタスクに最適です(そして、そのプラグインストアは、あなたが価格を支払うことをいとわないなら、本当に良いです)。一方、Bardはより事実に近く、正確で、インターネット接続を活用しますが、創造的なタスクには最適ではないかもしれません。
結局のところ、なぜどちらかを選ぶのか?どれが優れているか決める必要はありません。