生成音楽モデルは、トレーニングに使用した音楽を正確に再現する方法を学習しないということです。これは、音楽トレーニング データが、すべての可能なサウンドのスケールで限定された分布内に収まるためです。モデルは、トレーニング データの 1 つのポイント (つまり、特定の曲) ではなく、この音楽分布の一般的な範囲内で生成することを学習します。したがって、これらのモデルは「新しい」音楽を生成できますが、それはトレーニングに使用した分布内にのみ収まります。
これを、レゴで組み立て方を学ぶ子供のように考えてください。子供がレゴの宇宙船セットの説明書をたくさん見せられたら、学んだ宇宙船セットに似た新しい作品を作ることができるでしょう。しかし、エッフェル塔セットの説明書を見せられなければ、エッフェル塔に似たものの作り方がわかりません。つまり、子供が「新しい」作品を作ることはできても、それらはすべて宇宙船に似たものになります。同じように、音楽だけを訓練したモデルは、犬の吠える音を生成する方法を知りません。
You may also enjoy…
コメントを残す