SUNOAIに和楽器を演奏させたときの調査

PlanA

ジャンルバイアスを打ち消し、暗い空間で琵琶だけが鳴る状態を強制します。

  • 検証の極意NO OTHER INSTRUMENTS(他の楽器なし)と purely biwa(純粋に琵琶のみ)を指定しています。これで西洋のギターやベースが出現した場合、V5は「Biwa」というトークンを独立した波形として十分に学習していない(別の弦楽器でハルシネーションを起こしている)と確定できます。

[Genre] pure traditional japanese music, solo instrumental, [Mood] intense, dark, dramatic, [Instruments] deep resonant biwa solo, purely biwa, NO OTHER INSTRUMENTS, [Vocals] none, purely instrumental, Begin with a striking, deep resonant biwa solo in a quiet space. The solo biwa continues to play dramatic, traditional japanese melodies with heavy attack and deep resonance. No other instruments exist.

感想

4つ作られた曲はすべてピアノのソロパートです。 琵琶は存在しません。

PlanB

西洋ドラムセット(Kick/Snare/Hi-hat)の構成要素が全く無い「純和風の打楽器のみ」の構成をテストします。

  • 検証の極意No western drums exist(西洋ドラムなし)と明記しています。これでLo-Fi的なハイハット(チッチッチッという音)や、ロック的なシンバル、スネアドラムに類似するバネの響きが混入した場合、V5は「打楽器=西洋ドラムセットの亜種」という強力なバイアスから抜け出せていないことになります。

[Genre] pure traditional japanese percussion, taiko ensemble, solo instrumental, [Mood] powerful, rhythmic, primal, [Instruments] massive wooden taiko drums, sharp tsuzumi, purely traditional percussion, NO OTHER INSTRUMENTS, [Vocals] none, purely instrumental, Start with the sharp, high-pitched strike of a solo tsuzumi, followed by the deep, massive boom of heavy wooden taiko drums. The rhythm builds using only traditional japanese percussion. No western drums exist.

感想

これはプロンプト通りにアンサンブルです。

重厚な太鼓は再現しようとしてますが、これは和製の太鼓ではありません、太鼓の縁を叩く音が一切ないのが根拠です。演奏の違いでしょうか?随分と疾走感のある音色です、民族のような叩き方をしてます、「ドン」というより「ジャ」とした音です、民族の楽器で太鼓らしい音がでる有名なアイテムといえば?

これは新しい発見です、SUNOは太鼓っぽい?演奏でソロができるくらいの学習量があります。あとは演奏方法を指示できるか調査します、太鼓の縁を叩く音が聞こえないのが気がかりです。 導入は琴のような音色です、シャープな鼓はどこにもありません

検証結果

Sunoは琵琶という楽器を学習してない説

「Biwa」という単語が、音色データとしてAIの辞書に登録されていなかった(あるいはピアノに上書きされるほど弱かった) そのためsolo instrumentaldeep resonant という指示をAIが苦し紛れに「ピアノ」として出力した。

これはAIが知っている最も汎用的なソロ楽器(デフォルトフォールバック)としてピアノを選択したためと考えられる。

太鼓に対する学習が浅い

Sunoは「Taiko」を認識していますが、それは「日本の太鼓(バチと木)」ではなく、「ジャンベ(Djembe)やコンガ(Conga)といった手で叩くアフリカ・ラテン系パーカッション」みたいな手で叩く民族ドラムと完全に混同しています。

これは太鼓を「汎用的な世界の民族ドラム(手で叩く皮)」として誤認(汎化)して学習している可能性が極めて濃厚です。また、鼓(Tsuzumi)が理解できず、日本の音=「琴」という安易なバイアスで逃げた(フォールバックした)ことも明白です。

感想

これはSunoの現状の弱点といえます。幸いなことに日本の伝統文化はビジネスデータとしてまだ学習されてないのです。