真新しいガジェットが、AIにどっぷり浸かったテック系プレスの注目を集めた。ポケット・コンパニオン」と形容されるラビット・テックのR1は、水曜日のCESで発表された。
R1はラージ・アクション・モデルを搭載し、スマートフォンと同じようにAIアシスタントをポケットに入れて持ち歩くことができる。このガジェットは瞬く間にネット上で多くの議論と嘲笑の的となり、その一方で初回ロットの1万台は24時間以内に完売した
。
r1を作り始めたとき、発売日に500台売れれば満足だと社内で言っていました。24時間で、すでにその20倍を達成しました!
初日で10,000台!
第2弾はhttps://t.co/R3sOtVWoJ5。
お届け予定日は2024年4月~5月です。pic.twitter.com/XqaHqqk36L– 株式会社ラビット (@rabbit_hmi) 2024年1月10日
R1の心臓部はAIの賢さだが、ギミックはハードウェアにある。小さなスクリーン、アナログスクロールホイール、回転式カメラを備えた奇妙かつミニマルなデザイン。
R1をより深く見る
R1のスペックは特に印象的なものではありません。
「筐体の中には、2.3GHzのMediaTek Helio P35プロセッサー、4GBのメモリー、128GBのストレージ、USB-Cポート、空のSIMカードスロットが搭載されています」と同社は公式プレスリリースで述べている。ちなみに、Helio P35は2018年に発売され、サムスンのGalaxy A12やファーウェイのHonor 8Aといったミドルレンジのスマホを搭載していた。
しかし、ソフトウェアが強力な差別化要因となっている。LAMは、従来の言語処理モデルを超える複雑なAIシステムだという。人間の指示やウェブアプリケーションやインターフェイスとのインタラクションに基づくアクションを理解し、実行するように設計されている
。
Rabbit Techによると、LAMはニューラルネットワークの方法論と記号的アルゴリズムを組み合わせたものだという。このハイブリッドなアプローチにより、AIは従来のニューラルネットワークのようにデータから学習するだけでなく、記号システムのように事前に定義されたルールやロジックに従うことができる。
その結果、複雑な構造やユーザーのアクションを理解できる、より堅牢で汎用性の高いモデルが生まれ、トークン化やサービス全体のための大規模なコードを構築することなく、他のサイトとのインタラクションが容易になります。
LAMのトレーニングには、観察と模倣学習が含まれる。同社によれば、インターフェイスやアプリケーションとやりとりする人間のユーザーを観察することで学習し、どのようにアクションが実行されるかのニュアンスを捉える。基本的なユーザーであれば、十分な時間があれば、APIコールに頼る代わりに、ボタンが押されたら注文が入ることを理解し、APIキーがない場合やサイトのデザインが変更された場合でも、ユーザーがアクションを設定できるようになる。
従来の言語モデルは、ユーザーインターフェイスを扱う際に限界に直面し、多くの場合、インターフェイスをテキストや画像に変換する必要がある。Rabbit社によると、同社のLAMはインターフェースと直接対話することでこれらの制約を回避し、より高速で正確なタスク実行につながるという。
これを実現するために、R1チームは “ラビット・ホール “と名付けたクラウド環境を構築した。このプラットフォームは、一般的に使用されているウェブアプリケーションのコンポーネントをホストし、LAMが安全かつ効率的にそれらと対話できるようにする。ラビット・ホールは、ユーザーのデータとインタラクションが保護され、機密情報にアクセスできないことを約束する。
ラージアクションモデル? AIデバイス?いや
R1の登場は熱狂的な喝采に包まれたわけではなかった。批評家たちは、ラビット・テック創業者でCEOのジェシー・リュウによる基調講演はあまり力強いものではなく、多くの人がこのデバイスのポイントや何ができるのかを理解していなかったと述べている。
好奇心旺盛な人たちも、潜在的な欠点や、コストからコンセプトの将来性まで、ラビットが対処しなかったことについて懸念を共有していた。
AIコンサルタントでYouTuberのオリビオ・サリカスは、なぜこのデバイスがスマートフォンで簡単に置き換えられるのかを説明するビデオを作成した(これが批評家の間で主なポイントとなっている)。彼はティーンエイジ・エンジニアリングとのコラボレーションを賞賛したが、コミュニティの多くの人々と同じようにR1への共感は示さなかった。
“私はAIやLLMに反対しているわけではない “と彼はTCNに語った。”私の批評は、このデバイスがその目的に対して過剰に設計されているように見えるということだ”。
サリカス氏はその後、ラビット・テックが大きな市場浸透を図る上で直面する潜在的な課題を指摘するツイートを投稿した。
私の推測では、このデバイスは一般的なアプリ市場で支持されるほどのユーザーを獲得できないだろう。仮に不思議なことが起きて、これが25万台売れたとしよう。ドアダッシュのアクティブユーザーは3200万人。これは0.78%だ。このデバイスを統合して… pic.twitter.com/8m1A5NHJBb
– Olivio Sarikas (@OlivioSarikas) 2024年1月11日
もうひとつの懸念は、デバイスとは別のサービスのコストだ。テックエージェンシー「We Are Mobile First」の創設者リー・ヒギンズは、かなりの計算能力を必要とするAIへの無制限アクセスを約束しながら、デバイスを199ドルで販売し、サブスクリプション料金を無料にすることは経済的に困難だと述べた。
LAMのような高度なAIシステムの運用には高いコストがかかることを考えると、ラビット・テックのビジネスモデルの持続可能性には疑問が残る。
199のような高度なAIシステムの運用には高いコストがかかり、サブスクリプションもない。まともな能力を持つLLMの計算コストを考えると、それが実現可能だとは到底思えない。どうすれば可能なのか説明してください。
-リー・ヒギンズ(@Depthperpixel) 2024年1月10日
。
しかし、最も多い不満はR1が不要だというものだ。サリカスは、既存の技術と比較してラビット・テックのR1デバイスの必要性について懐疑的な見方を示した。
「スマートフォンにはないような余分な技術が搭載されているようには思えないからだ。彼は、R1とApple WatchやGoProを対比することで、この点を詳しく説明した。Apple WatchやGoProは、スマートフォンと似たようなことができるが、スマートフォンが理想的でない状況に合わせた機能を提供している。
「R1が独自のハードウェアを必要とする理由がわからない」と彼は主張した。
それは何をするのか?
– nic op_cat-er (@nic__carter) 2024年1月11日
多くの人々は、たとえAIの実装が同社が言うように斬新で革新的であったとしても、大手ハイテク企業であればR1の機能をほぼ簡単に複製できることをすぐに指摘した。
AIのハイプ・サイクルの最中に登場したAI中心のガジェットは、R1が初めてではない。月額24ドルのサブスクリプション付きで699ドルのHumaneのAI Pinも、この分野への参入者だ。R1とは異なり、Humane Pinはそのコンセプトをさらに一歩進めたもので、緑色のレーザーで手のひらに情報を映し出すウェアラブル・デバイスだ。
最新のクアルコム・スナップドラゴン・プロセッサーを搭載し、カメラ、深度センサー、モーションセンサーを使用して環境と相互作用する。Pinはスタンドアローン・デバイスとして設計されており、Cosmos OS上で動作し、マイクロソフトとOpenAIのAIモデルを統合している。音声ベースのインタラクション、翻訳サービス、AIを活用した写真撮影、さらにはタイダル音楽ストリーミングからパーソナライズされたAI DJを提供する。
R1はテック界でニッチを切り開く可能性があるが、多くの懐疑的な人々の心をつかむまでにはまだ長い道のりがある。サリカスがTCNに語ったように、「何千もの “アプリ “があるChatGPT(と)GPT Storeとこの製品のどちらかを選ぶとしたら、なぜ私はRabbit 1を選ぶのだろう」
。