ここからが本当にすごいところです。Snowbunnyのチェックポイントは、ネイティブ音楽生成についてもテストされています。しかも、テキスト読み上げや基本的な効果音の話ではなく、実際にゼロから作曲するのです。
公表されたある内訳では、次の通りです。
・Gemini 3.5 では、オリジナルの音楽トラックを作成するように促されました。
・出力は MIDI や記号音符だけではなく、波形レベルのオーディオも含まれていました。
・視覚化では、複数の楽器のトラックと非自明なダイナミクスと一致する、階層化された有機的な波形構造が示されました。
これにより、このモデルはSunoやUdioといった音楽に特化したツールと同等の扱いを受けることになりますが、重要な違いがあります。それは、生成がマルチモーダルかつコンテキスト依存的であるということです。