メタバースの野望が破たんした今、Metaは次のステージの開発を推進するためにAIに注目しています。ソーシャルメディアの巨人が水曜日に発表したMetaの最新プロジェクトの1つは、Segment Anything Modelと呼ばれています。
Segment Anythingは、ユーザーが数回クリックするだけで、画像内の特定のアイテムを特定できるようにします。まだデモモードですが、同社によると、Segment Anythingはすでに写真を撮影し、写真内のすべてのものを構成するピクセルを個別に識別して、1つまたは複数のアイテムを残りの画像から分離することができるそうです
。
SAMと一緒に熱くなるメタちゃん
Segment Anything Model (SAM)は、プロンプトが表示されるセグメンテーションシステムです。どんな画像でも、どんなオブジェクトでも、ワンクリックで「切り取る」ことができます。
マスクは、動画での追跡、画像編集アプリの実現、さらには3Dへのリフトアップが可能です。
クイックツアーとテストですpic.twitter.com/YC0JSWYy9X
– Nick St. Pierre (@nickfloats) April 5, 2023
」。
“セグメンテーション(どの画像ピクセルがオブジェクトに属するかを特定すること)は、コンピュータビジョンの中核的なタスクであり、科学的画像の分析から写真の編集まで、幅広い用途で使用されています “とMetaは新モデルを発表する投稿で述べています。
Meta社は、特定のタスクに対して正確なセグメンテーションモデルを作成するには、AIトレーニングインフラと慎重にアノテーションされた大量のドメイン内データへのアクセスを持つ技術専門家による高度な専門作業が必要となると述べています。
“我々は、前例のないサイズの新しいデータセットを収集することで、これまでのアプローチよりも大きな一般化を達成します。” MetaのリサーチサイエンティストであるRoss Girshickは、TCNに電子メールでこう語っています。”決定的なのは、このデータセットにおいて、我々は、アノテーションしたオブジェクトの種類を制限しなかったことです。
“データのスケールとその一般性のおかげで、私たちの結果モデルは、自我中心の画像、顕微鏡、または水中写真のような、トレーニング中に見られなかった画像のタイプを扱うための印象的な能力を示しています “とGirshickは付け加えました
。
生成型人工知能とは、プロンプトに反応してテキストや画像などのメディアを生成するA.I.システムである。この技術の最も顕著な例として、OpenAIのChatGPTやデジタルアートプラットフォームのMidjourneyがある。
Metaによると、Segment AnythingのAIシステムは、1100万枚以上の画像で訓練されたという。Girshickの説明によると、MetaはSegment Anythingを寛容なオープンライセンスであるApache 2.0の下で研究コミュニティ向けに公開しており、Segment Anything Githubを通じてアクセスすることができる。
“Oak View Law Groupの主席弁護士であるLyle Solomon氏は、TCNに対し、「プライバシー法の重要な側面は、データ収集は透明性をもって、個人の完全な同意を得て行われなければならないということです」と述べています。”明示的な同意なしに顔認識のためにAIを使用することは、プライバシー法違反の可能性について疑問を投げかけるものです。さらに、企業は、個人の同意がない限り、顔のデータを第三者と共有することを避けるべきであり、共有する場合は、プライバシー法の規定を遵守する必要があります。”
Girshickによると、Segment Anythingは研究段階であり、本番で使用する予定はないとのことです。それでも、人工知能の潜在的な利用法には、プライバシーに関わる懸念がある。
2月、Metaはメタバースを立ち上げる計画から、人工知能を含む他の製品に焦点を当て、ジェネレーティブA.I.に焦点を当てた新しい製品グループの設立を発表した。このシフトは、同社がInstagram NFTプロジェクトを終了した後に1万人以上の従業員を解雇した後に起こった。
人工知能の進歩に疲弊した世界のリーダーたちは、OpenAIのChatGPTの発売後、このテクノロジーとユーザーのプライバシーと安全にとって何を意味するかについて懸念を表明し、調査を開始しました。イタリアではすでにこの人気チャットボットを禁止しています。
ソーシャルメディアとA.I.コンサルタント会社Ruby Media Groupの社長Kristen Rubyは、「多くのユーザーは、自分の顔が同意なしに機械学習モデルの訓練に使用された場合、このプロセスがどのように機能するか、またはこの結果が長期的にどうなるかを理解していない」とTCNに語っている。
「多くの企業が抱える最大の課題は、大規模な学習データへのアクセスを得ることであり、ソーシャルメディアネットワーク上で人々が提供する学習データほど優れたソースはありません」と、彼女は述べています。
ルビー氏は、企業が機械学習に関する条項を設けているかどうかを確認し、自分のデータがどのように使用されているのか、また将来の学習モデルから外れることができるかどうかをユーザーに知らせることを提案します。現在、多くの企業がオプトインの初期設定をしていますが、将来的にはオプトアウトに変更される可能性があると彼女は指摘しています。
「私たちは、顔やその他の個人を特定する情報(ナンバープレートなど)をぼかすなど、さまざまなプライバシー保護技術を採用しています」とGirshickは述べています。”ユーザーは、不快なコンテンツを報告することができます。[email protected]、画像のIDを記載したメールを送信することで、データセットから削除します。”