アナ・リュウ/ビジュアル・チャイナ・グループ/ゲッティイメージズ
2023年3月19日、ワシントン州シアトルの本社で見られるMicrosoftの看板。
ニューヨーク
CNN
—
マイクロソフトの新しい AI テクノロジーのおかげで、モナリザはただ微笑む以上のことができるようになりました。
先週、マイクロソフトの研究者らは、顔の静止画像と話している人の音声クリップを撮影し、その人が話しているリアルなビデオを自動的に作成できる、開発した新しいAIモデルについて詳しく説明した。 似顔絵やアートワークだけでなく、現実の顔からも作成できるビデオは、説得力のあるリップシンクと自然な顔と頭の動きを備えています。
ある実験ビデオでは、研究者らはモナリザをアニメーション化して女優アン・ハサウェイのコメディーなラップソングを朗読する様子を示した。
AI モデルからの出力は次のように呼ばれます。 ヴァーサ-1、面白くもあり、現実的にはやや矛盾しています。 マイクロソフトは、このテクノロジーは教育に使用でき、「コミュニケーションに困難を抱える個人のアクセシビリティを改善する」、あるいはおそらく人間の仮想コンパニオンを作成するために使用できる可能性があると述べた。 しかし、このツールが悪用され、実際の人間になりすますために使用される可能性があることも容易にわかります。
これは Microsoft の枠を超えた懸念です。AI によって生成された魅力的な画像、ビデオ、オーディオ クリップを作成するためのツールがさらに登場するにつれて、 専門家は懸念している そして、それらの誤用は、新たな形の誤った情報につながる可能性があります。 また、テクノロジーが映画から広告までクリエイティブ産業をさらに破壊するのではないかと懸念する人もいます。
現時点でマイクロソフトは、VASA-1モデルを直ちに一般にリリースする予定はないと述べた。 この動きは、Microsoft パートナーである OpenAI が周囲の懸念に対処する方法と似ています。 人工知能が生成するビデオツールSora:OpenAIは2月にSoraをからかったが、これまでのところテスト目的で一部の専門ユーザーとサイバーセキュリティ教授にのみ利用可能にしている。
Microsoftの研究者らはブログ投稿で「我々は、現実の人々に誤解を招くコンテンツや有害なコンテンツを作成するいかなる行為にも反対する」と述べた。 しかし、「技術が適切な規制に従って責任を持って使用されることを保証するまで」、同社は製品を「一般公開する予定はない」とも付け加えた。
研究者らによると、マイクロソフトの新しいAIモデルは、話している人の顔のいくつかのビデオでトレーニングされており、「唇の動き、(唇以外の)表情、視線、瞬きなど」を含む自然な顔と頭の動きを認識するように設計されているという。 ” 他のもの”。 VASA-1 が静止画像をパンすると、よりリアルなビデオが得られます。
たとえば、ビデオゲームをプレイしていると思われる誰かが興奮しているように見えるクリップを設定したあるテストビデオでは、話している顔は眉間にしわを寄せ、唇をすぼめていました。
AI ツールは、被写体が特定の方向を向いたり、特定の感情を表現したりするビデオを作成するように指示することもできます。
よく見ると、まれなまばたきや誇張された眉の動きなど、ビデオが機械で生成された痕跡がまだ残っています。 しかしマイクロソフトは、自社のモデルが他の同様のツールを「大幅に上回り」、「人間の会話行動を模倣する実物そっくりのアバターとのリアルタイムの対話への道を開く」と信じていると述べた。
“Analyst. Television trailblazer. Bacon fanatic. Internet fanatic. Lifetime beer expert. Web enthusiast. Twitter fanatic.”
More Stories
PS5 Proは数週間以内に発表されるのは確かのようだ
リークにより、疑惑のPS5 Proデバイスの名前とデザインが明らかに
Apple、最新の iOS アップデートで写真内の AI オブジェクト除去を導入