もし気に入ったら購読料お願いします

購読料

最新モデルのSuno v5は、前バージョンであるv4.5+と比べて明らかに技術的に進歩している。しかし、ほとんどのAIアートに漂う味気ない空虚感から逃れられていないようだ。オーディオ品質の全面的な向上は否定できないが、例えばアーティファクトの減少や楽器間の分離の明確化などがある。v4.5+を使用して作成された一部のトラックは、ギター、ベース、シンセの境界線がせいぜい不明瞭なほどにメロディーパートをすべて押しつぶしてしまうことがある。しかしv5では、ミックスははるかにクリーンだ。関連記事AI生成アーティストがレコード契約を結ぶとどうなるか?著作権の問題 デモ中、Sunoのプロダクトマネージャーであるヘンリー・フィップス氏は、モデルに生成させたある曲を指差してこう言いました。その曲には、ピンポンディレイのようなエフェクトがかかったフルートのようなシンセサイザーが含まれていました。「以前のモデルではこんな音は聞いたことがありません…これは、モデルが、この音はエフェクトのかかっている独立した音であり、ステレオフィールドのさまざまな場所で忠実に再現する必要があることを理解していることを示しています。」Sunoは実際には従来の意味でのエフェクトを適用していないため、これはモデルが特定の楽器を識別し、ステレオディレイの音に近似していることを意味します。なぜなら、そのように聞こえるべきだと判断されているからです。Sunoのボーカルにはエッジがありません。すべてがリバーブに浸され、ハーモニーが重なり、ピッチは完璧です。これらの操作を行わないように明示的に指示しても、モデルはそれを無視します。Sunoはまた、v5ではジャンルの理解度が向上したと主張していますが、私のテストではその主張は疑わしいようです。 「グリッチだけどファンキーなドラム、雰囲気のあるメロディーパート、ブレスっぽいボーカルが特徴のモダンアヴァンギャルドR&B」といった私の要望に対しては、v5もv4.5+も、私の思い描いていたもの(主にKelelaのTake Me Apart)を実現する上で明らかに勝者とは思えませんでした。どちらもダウンテンポのトラックとムーディーなシンセサイザーで近いものを提供してくれましたが、私が期待していた奇妙さには欠けていました。Sunoも、私が求めていた「4トラックカセットレコーダーで録音した、キーの外れたボーカルと少し音程を外したギターを使った90年代初頭のローファイインディーロック」をなかなか理解できませんでしたが、v5は明らかに的外れでした。私が試したあらゆる努力にもかかわらず、SunoからはPavementに少しでも似たサウンドを吐き出すことができませんでした。SlantedやEnchantedを連想させる、ゆるくてスラッカーなノイズポップは、どこにも見つかりませんでした。代わりに、分厚いリフとクリーンで力強いパワーコードが特徴的な、大げさな「インディー」ロックが流れてきました。Suno v5は、世紀の変わり目以前にリリースされたどの曲よりもアークティック・モンキーズに似た曲を次々と再生しました。同様に、私のテストでは、v5は特定の時代や年代の指定に時々苦労しているように感じました。「1970年代後半のクラウトロック」と尋ねたところ、v4.5+はボーカル以外はほぼ完璧に聞き取れました(これについては後ほど詳しく説明します)。しかしv5は、80年代風のシンセポップや、古典的なクラウトロックDNAを持ちながらも、明らかにより現代的なサウンドのトラックを生み出すことが多い。私が言えることは、Sunoのv5モデルが作り出すアレンジメントははるかに複雑であるということ。v4.5+と比較すると、過度な繰り返しを避けるための単発の音楽的装飾が増え、曲の構成がより多様化している。v4.5+は通常、基本的なバース-コーラス-バースの構成(おまけにブリッジを追加)に満足しているのに対し、v5はプレコーラスまたはポストコーラスセクション、複数のブリッジまたはブレイクダウンを持つことが多く、一般的にトラック全体にわたって構築され、個別のセクションだけでなく、より多くの弧を提供している。また、既存のトラックをリミックスしたときにも、興味深い結果をもたらすことがあった。数年前にリリースしたEP(おそらく著作権フィルターが引っかかるはずだった)から一曲をアップロードしたのですが、正直に言うと、ギターソロの一部をシンセの繰り返しモチーフに書き起こしたり、大胆なコードパッドを躍動感のあるアルペジオに変えたりするところが気に入っていました。でも、Sunoに作ってもらった私の曲のカバーのすべてに欠けていたのは、約6年前、午前3時にリビングルームで録音したトラックの生々しさとローファイさでした。そして、それがこの作品に共通するテーマになっています。Sunoはテープヒスや息継ぎなど、古い録音や人間のパフォーマンスの表面的な特徴を模倣することはできますが、どうしても不自然な感じがします。Phipps氏も、ボーカルモデルが実際の人間のパフォーマンス特有の不完全さを再現するのを聞いたことがないと認めています。 Sunoはv5の初期のメッセージで「感情豊かなボーカル」と「人間のような感情の深さ」を謳っていたが、現在では公開されている資料にはその表現は見当たらない。その代わりに同社はボーカルを「自然で本物」と表現し、この変更は「スタイル上の選択」だとしている。しかし、それさえも無理があるように感じる。確かにv4.5+と比べるとボーカルはより人間らしく感じられるが、まだぎこちない。Phipps氏は「Suno [v4.5] のボーカルが感情的に平坦だと感じるのは、エッジを与えるディテールが欠けているからだと思います」と説明し、v5モデルのより高い忠実度がそのディテールを実現していると述べている。ボーカルパフォーマンスはより詳細になっているという技術的な側面については異論を唱えにくいが、それでもどれもひどく凡庸だ。ロックのボーカルはどれもイマジン・ドラゴンズやマムフォード・アンド・サンズのように、R&Bはどれも夢遊病者のアデルか魅力のないアリアナ・グランデのように聞こえてしまう。Sunoのボーカルにはエッジがない。すべてがリバーブに浸され、ハーモニーが重なり、完璧なピッチで演奏されている。たとえ明示的にこれらの操作を行わないように指示しても、モデルは無視する。私はv5に「リバーブ、ハーモニー、エフェクトなし、ドライボーカルのみの、加工されていない感情的なアカペラの女性ソロボーカル」を依頼した。その結果、2曲が再生されたが、どちらもリバーブに浸され、最初のボーカルには追加のボーカリストがハーモニーを奏でていた。中にはベースの伴奏のように聞こえるものもあった(もっとも、ベースを模倣した声だった可能性もある)。しかし、フィップス氏は驚かなかった。「モデルはまだ特定のエフェクトや録音技術の説明を理解していない。ボーカルのパフォーマンスは歌詞と全体の雰囲気に最も左右される」と彼は言った。そこで私は、著作権侵害のフラグが立たない程度にローリングストーンの「ギミー・シェルター」とは多少異なる歌詞をスノに入力してみた。一見したところ、原曲をあの衝撃的なものにしている要素をすべて備えているように思えた。力強い女性ボーカリストが、ブルージーなアレンジメントに乗せてシャウトする。しかし、まるで歯科の教科書のような感情的なインパクトがあった。「ギミー・シェルター」を聴くと、ブリッジ部分でメアリー・クレイトンが「レイプ・アンド・マーダー」と力強く歌う時の声がかすれる様子に、私は涙をこらえきれなかった。 「Why Can’t I Be You」の絶望感や、「Where Did You Sleep Last Night」の最後の歌詞を歌う直前のカート・コバーンの息づかいに表れる明らかな疲労感は、彼が本当の悪魔と闘っている男であることを物語っている。一般的に言って、Suno を「悪い」サウンド ― 音程外れ、生々しい、音程外れ、だらしない ― にしようとするのは無駄だった。新モデルのボーカルがいかに「自然」に聞こえるかについてメーカーはあれこれ語っているが、パフォーマンスの感情的な重みを伴うことが多い不完全さが欠けている。Suno のバーチャル ボーカリストたちは依然として超然としているように聞こえる。モデル v5 は特定の歌詞が悲しいものであることを理解するかもしれないが、言葉との実際の感情的なつながりはない。それは、モデルがコードの山であり、アーティストではないからだ。

もし気に入ったら購読料お願いします

購読料

もし気に入ったら購読料お願いします

購読料

もし気に入ったら購読料お願いします

購読料

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です