かつては、D-IDによる自動リップシンクと、場合によっては深度推定アニメーションを備えたMidjourneyの画像スライドショーが主流でした。今では、ElevenLabs(最も一般的な音声合成サービス)の音声が主流の、テキスト2ビデオクリップのスライドショーが主流で、やはり不気味な自動リップシンクが使われています。よくある特徴は、8Kの映画のようなショット、ナレーターによるナレーション、SFテーマ、ピクサー風の作品などです。基本的に、これはAI短編映画を作るための最も一般的で簡単な方法です。
You may also enjoy…
コメントを残す