スクラップで分散型のオープンソース人工知能モデルは、OpenAIの強力なGPT-4のような資金力のあるプロプライエタリなものに対抗できるのか?よく聞かれるこの質問は、元グーグルのAI研究者がどちらかを選んだ後、ツイッター上で活発な議論を巻き起こした。
ガリレオAIの共同設立者であるアルノー・ベナールは、「オープンソースのモデルが今年GPT-4を打ち負かすと思ったら大間違いだ。彼はOpenAIの才能とリソース、そしてLLMを超える製品としてのGPT-4の強固な性質を挙げ、オープンソースのプロジェクトが挑戦者からAIチャンピオンにシフトするのに苦労するかもしれないと主張した
。
f you think open-source models will beat gpt-4 this year, you’re wrong.
私は一流のAI研究所(google AI)で働き、月間500万ダウンロードを超えるオープンソースライブラリを構築した。
gpt-4は1年前のもので、今のところそれに匹敵するモデルはない:
1.才能-openaiが採用…
– Arnaud Benard (@arnaudai) 2024年1月1日
当然のことながら、ベナールのツイートは激しい支持から激しい反対まで、さまざまな反応を巻き起こした。
ニュースレター “Beyond The Yellow Woods “を執筆している人気のAIマニア、ライアン・ケーシーは、オープンソースAIの可能性についてより楽観的な見方を示し、彼の計算によれば、「オープンソースは今年中に(プライベートモデルに)匹敵するか、打ち負かすだろう」と述べた。「需要があれば、イノベーションが起こるだろう」
Eh, 私はオープンソースが今年に匹敵するか勝つと思う。pic.twitter.com/y99qKJ2iKF
– Ryan Casey (@ryansweb) 2024年1月1日
。
一方、AIストラテジストのジェレミ・トラグナは、”OpenAIのモデルは動き続けている “と指摘し、”オープンソースのモデルは、標的が攻撃される位置にいる時点で、動いている標的を攻撃するスピードに追いつくのは難しい “と付け加えた。言い換えれば、GPT-4の時代にはオープンソースのモデルはGPT-3.5に追いついているかもしれないが、GPT-4.5ターボに匹敵するジェネラリストLLMができる頃にはGPT-5が存在しているかもしれない。
技術アナリストのジョン・ハウエルズ氏は、オープンソースとクローズドソースのLLMを分ける基準は、リソースだけではないと考えている。
「Mistralは莫大な資金と素晴らしいチームを持っており、最近GPT-3.5を打ち負かすオープンソースモデルを発表した。「彼ら、もしくは似たような企業は今年中にGPT-4レベルのオープンソースモデルを出すだろう。
フランスのスタートアップであるMistral AIは、多くのユースケースでGPT-3.5を上回るパフォーマンスを提供するMixtral LLMをリリースし、知名度を上げた。
スレッド・ディスカッションの中で、Nous Researchの共同設立者である “Teknium “は、哲学的ではあるが、重要な点を指摘した。「OS(オープンソース)のあらゆる能力向上は、永遠に確実に使用できる世界から決して奪うことのできない恒久的なものだ」と彼は言った。基本的に、オープンソースのAI技術に何らかの進歩がある限り、どの企業もそのアクセスを制限することはできない。
togetherとmistralを紹介したが、どちらも怒っていない。しかし、この投稿で、GPT-4に勝てるOSモデルはないだろうと言っていたが、GPT-4は古いニュースになるだろう-おそらく今年中に-3.5に勝つのに時間はかからなかったし、MistralのCEOはGPT4レベルのOpenをリリースする予定だと言っていた…
– Teknium (e/λ) (@Teknium1) 2024年1月1日
。
オープンかクローズか?終わりなき議論
オープンソース対クローズドソースの論争は、WindowsとLinuxの初期のオペレーティングシステムの戦いを彷彿とさせる。ML SchoolのSantiago Pino氏は、プロプライエタリなAIモデルはWindowsのように一般消費者に勝利するかもしれないが、オープンソースソフトウェアは企業ユーザーにとって非常に有用なカスタマイズとコントロールを提供すると書いている。
ピノ氏は、多くの企業がChatGPTで実験を開始し、その後、特定のニーズやデータコンプライアンスの要件に合わせて微調整やカスタマイズが可能なオープンソースモデルに移行していることを強調した。オープンソースのソリューションはベンダーの囲い込みを避け、透明性を提供すると彼は言う。
「クローズドなプロプライエタリ・モデルは個人を獲得するかもしれないが、ほとんどの企業はマイクロソフトやグーグルにデータを送りたくない。彼らはコントロールしたいのです。オープンソースモデルがその答えです」と、バーナードのスレッドが拡散する数日前のツイートで述べた。
オープンソースモデルはChatGPTとGeminiを破壊する。
オープンソースの大規模言語モデルの物語はLinuxの物語だ。WindowsとMacは消費者を獲得したが、LinuxはインターネットのOSとなった。
ChatGPT、Gemini、そしてオープンソースモデルでも同じことが起こるだろう。クローズド、… pic.twitter.com/fdmS1VNtqf
-サンティアゴ (@svpino) 2023年12月22日
このような見解は、バーナードのツイートに関する議論の中で、オープンソースモデルのニッチな可能性を強調した、ソフトウェア開発会社であるSciumo Inc.によって共有された: 「(オープンソースのモデルは)重要なところで競争するだろう。(OpenAIにはない)ドメイン固有のデータと専門知識で、ドメイン固有の問題だ。
YouTubeチャンネル「SECourses」で知られるコンピューター・エンジニアのFurkan Gözükara氏も、より微妙なスタンスを持つ人物の一人だ。TCNの取材に対し、彼はバーナード氏の意見に同意し、”オープンソースのLLMがOpenAIに合格するのは、特定の課題においてのみである “と述べた。
Gözükara氏は、”(自社の)文書でLLMを訓練する “企業の例を挙げている。たしかにOpenAIには、特定の指示や文書に基づいてGPTをカスタマイズする機能があるが、第三者への機密データの取り扱いには常に懸念がつきまとう。その懸念は、パーソナライズされたGPTが第三者のユーザーに機密データを提供していたことが明らかになった最近、検証された。
メタ社のAI開発責任者で、オープンソースの猛烈な擁護者であるヤン・ルクンは、”オープンソースのAI基盤モデルは、クローズドでプロプライエタリなAIモデルを駆逐するだろう “と繰り返し述べている。オープンソースのモデルは、より速く、よりカスタマイズ可能で、よりプライベートで、ポンド単位でより有能である」と、2023年にリークされたグーグルのメモに書かれている。
オープンソースのモデルがGPT-4や今後のバージョンに匹敵するか、あるいは上回るかはまだわからない。しかし、双方の専門家の視点からは、興味深い緊張関係が浮かび上がってくる。クローズドソースのモデルは、リソースと迅速な反復において優位に立つかもしれないが、オープンソースのツールは急速に進化しており、恒久的な機能とカスタマイズ性を提供している。今のところ、AIコミュニティは競争の行方を見守りつつ、利用可能な最高のテクノロジーを使用することの利点を享受することができる。