Home » OpenAIが新たなウェブクローラーを発表、オープンウェブをさらに食い尽くす

OpenAIが新たなウェブクローラーを発表、オープンウェブをさらに食い尽くす

by v

OpenAIは、次世代のAIシステムをトレーニングするためのデータセットを拡張するために、新しいウェブクローリングボットGPTBotをリリースした。同社は “GPT-5 “という言葉を商標登録し、近日リリースされることを示唆すると同時に、ウェブパブリッシャーに自社のコンテンツをGPTの膨大なコーパスから除外する方法を警告している。

OpenAIによると、このウェブクローラーは、有料、機密、禁止されているコンテンツを避けながら、ウェブサイトから一般公開されているデータを収集する。しかし、グーグル、ビング、ヤンデックスといった他の検索エンジンと同様に、このシステムはオプトアウト方式を採用しており、デフォルトでは、GPTBotはアクセス可能な情報を公正なゲームと見なす。OpenAIのウェブクローラーがウェブサイトを取り込むのを防ぐには、その所有者はサーバー上の標準ファイルに「許可しない」ルールを追加する必要があります。
 src=
現在、

ChatGPTの月間アクティブユーザーは15億人を超えている。そして、マイクロソフトのOpenAIへの100億ドルの投資は、ChatGPTの統合がBingの機能を向上させたように、先見の明があるように見える。

今のところ、OpenAIは最もホットなAI分野をリードしており、テック大手は追いつこうと競争している。同社の新しいウェブクローラーは、そのモデルの能力をさらに向上させるかもしれない。しかし、インターネットデータ収集の拡大は、著作権や同意をめぐる倫理的な問題をも引き起こす。

AIシステムがより高度になるにつれ、透明性、倫理、能力のバランスを取ることは、複雑なバランス行為であり続けるだろう。

Related Posts

Leave a Comment