大規模言語モデル (LLM):自然言語テキストを処理および生成できる AI モデルの一種。Anthropic の Claude は、同社によれば「会話調の親切で誠実、そして無害なアシスタント」であり、LLM の一例です。
引用ジャングルは同名のTumblrページからインポートしています
最新の知見を知るサイト
-
-
拡散モデル:テキストプロンプトから画像を生成するなどの用途に使用できる AI モデル。最初に画像にノイズ (静電気など) を追加し、次にそのプロセスを逆にすることでトレーニングされ、AI が鮮明な画像を作成する方法を学習します。オーディオやビデオで機能する拡散モデルもあります。
-
基礎モデル:これらの生成 AI モデルは膨大な量のデータでトレーニングされているため、タスク専用のトレーニングなしで、さまざまなアプリケーションの基盤となることができます。(この用語は、2021 年にスタンフォード大学の研究者によって造られました。) OpenAI の GPT、Google の Gemini、Meta の Llama、Anthropic の Claude はすべて基礎モデルの例です。多くの企業は、AI モデルをマルチモーダルとして販売しており、テキスト、画像、ビデオなど、複数の種類のデータを処理できることを意味します。
-
自然言語処理(NLP):機械学習により機械が人間の言語を理解する能力。OpenAI の ChatGPT は基本的な例で、テキストクエリを理解し、それに応じてテキストを生成できます。NLP を実行できるもう 1 つの強力なツールは、OpenAI のWhisper 音声認識技術です。同社はこの技術を使用して、100 万時間を超える YouTube 動画の音声を書き起こし、GPT-4 のトレーニングに役立てたと報告されています。
-
トークン:トークンとは、単語、単語の一部、または個々の文字などのテキストの塊を指します。たとえば、LLM はテキストをトークンに分割して分析し、トークン同士の関係を判断し、応答を生成します。モデルが一度に処理できるトークンの数が多いほど (「コンテキスト ウィンドウ」と呼ばれる量)、結果がより洗練されます。
-
ニューラル ネットワーク:ニューラル ネットワークは、ノードを使用してコンピューターがデータを処理するのを支援するコンピューター アーキテクチャです。ノードは、人間の脳のニューロンに似ています。ニューラル ネットワークは、明示的なプログラミングなしで複雑なパターンを理解することを学習できるため、人気の生成 AI システムにとって重要です。たとえば、診断を行うために医療データをトレーニングするなどです。
-
RAG:この頭字語は「検索拡張生成」の略です。AI モデルが何かを生成するときに、RAG により、モデルはトレーニングされた内容以外のコンテキストを見つけて追加できるため、最終的に生成されるものの精度が向上します。
AI チャットボットに、トレーニングに基づいて実際には答えを知らない質問をしたとします。RAG がなければ、チャットボットは間違った答えを思いつくだけかもしれません。しかし、RAG があれば、インターネット上の他のサイトなどの外部ソースをチェックし、そのデータを使用して答えを導き出すことができます。
-
トランスフォーマー:トランスフォーマーは、シーケンスの各部分が互いにどのように関連しているかを処理する「アテンション」メカニズムを使用するニューラル ネットワーク アーキテクチャの一種です。Amazon には、これが実際に何を意味するかを示す良い例があります。
次の入力シーケンスについて考えてみましょう。「空の色は何色ですか?」 トランスフォーマー モデルは、色、空、青という単語間の関連性と関係を識別する内部数学的表現を使用します。その知識を使用して、「空は青いです。」という出力を生成します。
トランスフォーマーは非常に強力であるだけでなく、他の種類のニューラル ネットワークよりも速くトレーニングできます。
-
レイ トレーシングはここ数年のリアルタイム 3D グラフィックスの最も驚くべき進歩の 1 つであると大々的に宣伝されているにもかかわらず、レイ トレーシングは、光が反射面から跳ね返る様子をリアルにシミュレートするために必要な非常に要求の厳しい計算を行わずに、ほとんど同じ外観を実現する、レイ トレーシング以前のビデオ ゲームで使用されていた「事前焼き付け」の照明トリックよりも実際にはそれほど見栄えがよくないということです。
それ以来、大幅に最適化され、レイ トレーシングをオンにしても実際に問題なく動作するようになりましたが、発売当初のサイバーパンク 2077 は、その良い例でした。レイ トレーシングをオンにすると、平均フレーム レートが 120 から 40 に低下します。目を細めてよく見ると、路上の水たまりが、環境に一致する 2D テクスチャで反射を「偽造」しているのではなく、街のネオン サインを正確に反射していることに気付くでしょう。これは、最新のビデオ ゲームを最大設定で実行するために何千ドルも費やすつもりだとしても 、あまり良いトレードオフではありません。
-
新しい研究によると、「デジタルスイッチング」(ビデオを頻繁に切り替えたり、早送りして早く見ようとする行為)は、切り替えを始める前よりも退屈に感じさせるそうです。次のビデオに移る前に、一度に 1 つのビデオを最後まで見たほうがよいでしょう。
複数の短い動画の間を移動したり、長い動画を早送りしたりすることを許可された参加者は、1つの動画を最初から最後まで早送りせずに視聴した人に比べて、より高いレベルの退屈を報告しました。動画を生で見ている人のほうが、はるかに良い結果でした。