投稿者: qqjjmas01 | 2024年11月9日 0件のコメント さまざまな入力モダリティ (オーディオ、テキスト、画像、ビデオ) を受け入れ、出力モダリティとしてテキストを返すマルチモーダル LLM の図。 (マルチモーダル LLM について – Sebastian Raschka 博士著から)