周波数磁気共鳴画像法(fMRI)が発明されてから30年経った今でも、人間の思考プロセスは謎に包まれていることを考えてみてください。fMRIを使用すると、研究者はさまざまなタスク中に脳のどの領域が活性化されるかを見ることができます。
引用ジャングルは同名のTumblrページからインポートしています
最新の知見を知るサイト
-
-
GenAIモデルには物理的な実体がないため、物理世界について知っていることはすべてデジタル データから推測されます。物理学、因果関係、または現実世界の制約に対する深い理解を必要とするタスクやプロンプトには苦労することがよくあります。
-
GenAI モデルは膨大な量のトレーニング データ (単語、画像、音声、動画) を取り込み、それを何らかの数学的な方法 (「埋め込み」と呼ばれる) で表現します。 たとえば、事前トレーニング フェーズでは、LLM がすべての入力テキストをトークン (単語と単語の一部) に分割し、各トークンに多次元ベクトル値を割り当てて、基本的にトークンを多次元空間に配置します。 (GPT-4 は 10 兆語でトレーニングされ、13 兆トークンに分割され、各トークンに 4,096 次元のベクトル値が割り当てられていると報告されています。)
-
GenAI モデルには、トランスフォーマー モデル (自己回帰モデルの一種で、シーケンス内の次の要素を予測する)、拡散モデル (ランダム ノイズを一貫性のあるものに変換して出力を生成する)、GAN (2 つのニューラル ネットワークを互いに競わせて最適な出力を生成する) など、さまざまな種類があります。現在、多くの AI アプリケーションでは、これらのモデルのいくつかが採用されています。たとえば、Sora と Veo はトランスフォーマー拡散モデルであり、Midjourney は (おそらく) トランスフォーマー モデルと GAN モデルの両方を使用しています。
-
アシュトン・カッチャーがSoraについて語っています。
[最終的には] 映画のアイデアを思いつくだけで、それが脚本を書き、その脚本をビデオ ジェネレーターに入力すると、映画が生成されます。誰かが作った映画を見る代わりに、自分で映画を作って見ることができます…何が起こるかというと、地球上で視聴する視聴者の数よりも多くのコンテンツが存在するようになるでしょう。つまり、コンテンツの価値は、人々に視聴してもらうことができるかどうかにかかっています。したがって、良いものに対するハードルは大幅に上がることになります。なぜなら、自分の映画を見ることができるのに、なぜ私の映画を見るのでしょうか?
-
Netflixの共同CEOテッド・サランドスは次のように語った。
作家、監督、編集者は、仕事をより良く、より効率的かつ効果的に行うためのツールとして AI を使用します。そして最良の場合、不可能と思われるものを画面に映し出すことができます。AI があなたの仕事を奪うことはありません。AI をうまく使う人があなたの仕事を奪うかもしれません。
-
最も変革をもたらす可能性のあるテクノロジーは、テキスト、画像、またはビデオ プロンプトから短いクリップを生成する AI ビデオ ジェネレーターです。フィルム フッテージの処理効率を高めると約束するツールとは対照的に、主要な撮影のほとんどまたはすべてを置き換えることで、ビデオを作成するまったく新しい方法を提示します。Runway が誇らしげに宣言しているように、「照明なし。カメラなし。すべてアクション」
-
多くの人が、いつか視聴者が GenAI を使用して独自の映画を作成できるようになると推測しています。数年前、Sequoia は、 2030 年までに「ビデオ ゲームと映画はパーソナライズされた夢になる」と述べたエッセイを発表しました。
-
考慮すべきもう 1 つの点は、GenAI は映画制作のコスト削減にのみ使用されるのではないということです。GenAI には独自の特性があり、独自の用途が広がります。
フォーマットやストーリーラインの実験が増え、表現の幅が広がり、ビデオでのファンの創作が広がります。
-
リニア視聴率はスポーツを除いて明らかに低下しています。そして、これらの低下が最も顕著なのは最も若い世代であることを示しています