アドビフラッシュやアニメーションのジブジャブeカードから、我々は長い道のりを歩んできた。
それから20年、コンピューターと少しの空き時間があれば、デジタル編集の知識ゼロでも、数回クリックするだけで、(実在の人物やイラストの)高品質なアニメーションを作成できるようになった。
これが、電子商取引と小売技術を専門とする中国の多国籍テクノロジー企業、アリババのAI研究チームが導入したAIモデル、「Animate Anyone」の売り文句だ。アリババのAI研究チームは、電子商取引と小売技術に特化した中国の多国籍テクノロジー企業である。どんな写真でも驚くべき一貫性と制御性でアニメートすることができると主張するアリババの技術を動画で紹介し、何百万人もの人々の想像力をかきたてている。
アリババによれば、Animate Anyoneは写真を動画に変換することができるという。「希望するポーズシーケンスによって制御され、時間的な連続性を達成することができる」と、AIアバターのスタートアップであるMyCompanionsはツイッターで説明している。「不具合も少なく、余計な指もいらない。
チームは、この技術はインフルエンサーの間で新しい使用例の扉を開くと付け加えている: AIが生成する洋服や、大量生産されつつもパーソナライズされた動画の市場創出などだ。
1枚の写真から短編動画?私たちはまもなく、すべてのインフルエンサーにこれを提供できるようになるでしょう!
アリババグループの最新の最先端調査によれば、これはもうすぐそこまで来ている。なぜこの技術が重要なのか?インフルエンサーはこの技術をどのように使うのがベストなのか?
以下のスレッドからどうぞ pic.twitter.com/C4QCJCeEXP
-マイコンパニオンズ (@MyCompanionsAI) 2023年12月3日
モデルのGitHubページには、ソースコードへのアクセス要求が殺到した。これに対してチームは、デモとコードの公開は未定であることを再確認した。
「私たちのプロジェクトに対する素晴らしいサポートと関心に感謝します。”私たちは、公開に向けてデモとコードの準備に積極的に取り組んでいることを保証したいと思います。”
この声明は1日足らずで240以上の「いいね!」を集めた。
デモ動画が正確なものであれば、Animate Anyoneを使用することで、基準となるキャラクターの外観を維持しながら、明瞭で時間的に安定した動画結果を作成することができる。これは、空間的な注意を介して詳細な特徴を統合することができるReferenceNetと呼ばれる新しいフレームワークに拡散モデルを統合した結果のようだ。
これを達成するために、参照画像を取り込み、希望するポーズに沿うようにパーツを動かし、生成されたビデオの各フレームで一貫した動きの錯覚を与えるために、埋める必要のあるギャップを埋める。いわゆるオープンポーズ・シーケンスにより、ほぼ完璧なアニメーションが得られます。
UVXSAUVXB
。
Animate Anyoneは、AnimateDiff、Warpfusion、Deforum、ebSynthなどの他の人気のあるアニメーションツールとも比較されています。これらの既存のツールは、一貫性のあるフレームを生成するのに不十分であることが多く、AIが生成した動画であることが容易に判別できる。対照的に、Animate Anyoneはより洗練された出力を誇り、フレームは一貫しており、アニメーションは現実とほとんど区別がつきません。
Animate Anyoneチームは、TCNからのコメント要請に回答していない。
熱狂の中、MagicAnimateという類似モデルも確かなライバルとして登場した。MagicAnimateは、アニメーションプロセスに対して少し異なるアプローチをとっている。人気はそれほど高くないが、このリリースは、AI駆動型アニメーションの領域をより深く探求したい人々に、代替手段を提供するものだ。
MagicAnimate: @Gradioによる拡散モデルを用いた時間整合性のある人物画像アニメーション @Gradio demo
ローカルデモ: https://t.co/ScsEU6oG64
本論文では、特定の動作に従った特定の参照IDの動画を生成することを目的とした、人間画像アニメーションタスクについて研究する… pic.twitter.com/JCOr0yCRZs
-AK (@_akhaliq) 2023年12月4日
拡散モデルを使用するAnimate Anyoneとは対照的に、MagicAnimateは画像からフレーム一貫性のある制御可能なアニメーションを作成します。独自のアピアランスエンコーダとビデオフュージョン技術により、長いビデオアニメーションのトランジションがスムーズになり、フレーム間のディテールがよりよく保持されると報告されている。
MagicAnimateは、時間的一貫性とフレームごとの品質に優れているが、競合他社ほど正確ではないようだ。
MaticAnimateをテストする機会を得た元Meta AI研究者のAlex Carliera氏は、「1つの画像から一貫性のある動画を生成するための素晴らしい第一歩」と評価する一方で、生成は参照画像に対して100%正確ではなく、一部のフレームで体が変形していると指摘した。
動画用のControlNet(MagicAnimate)をテストしてみた。
– モーションビデオのアイデンティティが、出来上がったビデオに漏れてしまう。
– 手と顔が悪い(意外にも!)。しかし、一貫性のある素晴らしい第一歩だ… https://t.co/zY9tZZ6MaK pic.twitter.com/J9XELE5NGT
– Alex Carlier (@alexcarliera) December 4, 2023
だから、もしあなたが踊れず、最新のTikTokの振り付けから取り残されていると感じているなら、アニメイトエニワンやMagicAnimateがあなたのバイラル成功への切符になるかもしれません。