アンソロピック、クロードをGPT-4ターボの約2倍の機能でアップグレード

これは、OpenAIが最近発表したGPT-4 Turboの12万コンテキストを上回る機能です。

この戦略的なリリースは、最も近いライバルの約2倍のコンテキスト処理能力をもたらし、Googleとの長期的なパートナーシップの成果であり、Googleの最先端のTensor Processing Unitsを使用することを可能にした。

「我々の新しいモデルClaude 2.1は、業界をリードする200Kトークンコンテキストウィンドウ、幻覚率の2倍の減少、システムプロンプト、ツールの使用、および更新された価格を提供しています」とAnthropicは今日初めにツイートで述べた。Claude 2.1の導入は、長文ドキュメントを正確に処理・分析できるAIに対する需要の高まりに応えるものです。

我々の新モデルClaude 2.1は、業界をリードする200Kトークンコンテキストウィンドウ、2倍の幻覚率の減少、システムプロンプト、ツールの使用、および更新された価格を提供します。

Claude 2.1はAPI経由でコンソールから利用可能で、https://t.co/uLbS2JNczH のチャット体験を強力にサポートします。pic.twitter.com/T1XdQreluH

-Anthropic (@AnthropicAI) 2023年11月21日

この新しいアップグレードは、クロードユーザーがコードベース全体や古典的な文学叙事詩のような広範なドキュメントに関与できるようになったことを意味し、法的分析から文学批評まで、さまざまなアプリケーションの可能性を解き放ちます

。

AI研究者のGreg Kamradt氏は、Claude 2.1モデルをさっそく試してみた。彼は、トークン数が少ないほどOpenAIのモデルに一貫性があることを発見したが、Claudeは異なる長さのプロンプトに応じてより多様な結果を示した。

「90Kトークンあたりから、ドキュメントの最下部での想起のパフォーマンスがますます悪化し始めました」と彼は結論づけた。彼の調査によると、GPT -4 Turboでも65Kトークンあたりから同様の劣化レベルが見られた。「私はAnthropicの大ファンです。彼らはLLMの性能の限界を押し広げる手助けをし、世界のための強力なツールを作っています」と彼は投稿した

。

クロード2.1（200Kトークン） – 長いコンテキストのプレッシャーテスト

私たちは皆、コンテキストの長さを長くするのが大好きです。

AnthropicがClaude 2.1の早期アクセスを提供してくれたので、私はGPT-4で行った「干し草の山の中の針」分析を繰り返した。

これは私が見つけたものです：… pic.twitter.com/B36KnjtJmE

– Greg Kamradt (@GregKamradt) November 21, 2023

AnthropicのAIエラー削減へのコミットメントは、クロード2.1の精度強化に表れており、幻覚発生率を50％削減したとしている。これは、クロード2.0と比較して真実性が2倍になったことを意味する。これらの改良は、現在のモデルの限界に挑戦するために設計された、複雑で事実に基づいた質問セットに対して厳密にテストされた。TCNが以前報告したように、幻覚はクロードの弱点の一つであった。このような飛躍的な精度向上は、LLMをGPT-4とより緊密に競争させることになる。

APIツール使用機能の導入により、Claude 2.1はまた、上級ユーザーのワークフローによりシームレスに統合され、様々な機能間のオーケストレーション、ウェブ検索、プライベートデータベースからのプル機能を発揮する。まだベータ版ではあるが、この機能により、複雑な数値推論から製品の推奨に至るまで、Claude の有用性が広範囲に及ぶことが期待される。

さらに、AnthropicのClaude 2.1は「システムプロンプト」を特徴としており、ユーザーとAIとの対話を高めるように設計されている。このプロンプトにより、ユーザーは役割、目標、スタイルを指定することで、クロードのタスクの舞台を設定することができ、ロールプレイシナリオでクロードのキャラクターを維持し、ルールを遵守し、反応をパーソナライズする能力を強化することができる。これはOpenAIのカスタム指示に匹敵するが、コンテキストの点ではより広範囲に及ぶ。

例えば、財務報告書を要約する際に技術アナリストの口調を採用するようクロードに指示し、アウトプットが専門的な基準に沿うようにすることができる。システム・プロンプトによるこのようなカスタマイズは、正確性を高め、幻覚を減らし、インタラクションをより正確で文脈に即したものにすることで、作品全体の質を向上させるかもしれない。

しかし、20万トークンのコンテキストウィンドウを持つClaude 2.1の完全な可能性は、Claude Proユーザーに予約されているため、無料ユーザーは、10万トークンとGPT 3.5とGPT-4の中間にランクされる精度を持つClaude 2に固執する必要があります。

クロード2.1のリリースの波及効果は、AI業界内の力学に影響を与えそうだ。企業やユーザーがAIの選択肢を評価する中で、Claude 2.1の強化された機能は、その精度と適応性のためにAIを活用しようとしている人々に新たな考慮事項を提示する。

アンソロピック、クロードをGPT-4ターボの約2倍の機能でアップグレード

ユービーアイソフトのNFTゲーム「チャンピオン・タクティクス」がAnimocaの「Mocaverse」に登場

クルーズCEO、自動運転車の安全性危機で退任

Related Posts

Leave a Comment Cancel Reply