さまざまな入力モダリティ (オーディオ、テキスト、画像、ビデオ) を受け入れ、出力モダリティとしてテキストを返すマルチモーダル LLM の図。

(マルチモーダル LLM について – Sebastian Raschka 博士著から)

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

You may also enjoy…