Home Artists Posts Import Register

Content

こんばんは。みなとです。

最近あつくてたいへんです。


UTAU の 3 つの要素

 この度、nmasao1 さんの ust を全部で 249 個お借りして、さまざまな集計を行いました。

 それに伴って改めてわかる、UTAU音源において重要なの 3 つの要素、

 「音階」 「歌詞」 「長さ」

 これらについて全3回分の記事で、以下の内容を書いていく予定です。

 後の記事を書いたあとに加筆・修正するかも。


0.前提

 0.1 ust の条件

1.音階                ←今回はここ

 1.1 音階の登場頻度

 1.2 音階の遷移の傾向

2.歌詞

 2.1 新しく制作したリスト 「頻度重み順 CV-VC(V)」

3.長さ

 3.1 最適な収録長



0.前提

 ust をお借りした、とは言いましたが、全てをそのままお借りしたわけではないです。

 おおむね以下の条件で除外や変更を加えています。


0.1 ust の条件

 ・ハモリの ust は除外

 ・セリフしかない、あるいは極端に短い ust も除外

 ・特殊な音素は都度修正

  └例) 「息」 などを 「R」 に置換


 …など完全にそのまま全部使用しているわけではないです。

 そもそも手動で ust を若干整えるのが地味にしんどいので、これくらいの数で勘弁してください。



1.1 音階の登場頻度

 まずは、というかこちらの図をご覧ください。

 これが全ての結果です。

 赤くしたところが、全 ust で最も使用されていた音階です。

 G4 で、9815 回使われていました。

 単純計算で、1 つの ust 内で 9815 / 249 ≒ 39.4 回 G4 で音源が使われるわけです。


 使用した ust は大抵女声キーの歌だったので、これはつまり

 「女声音源は最低でもG4は録っておけばOK」

 ということや、

 「男声音源はG4より上を録る意味はそんなにない」

 ということが分かります。


 あるいは、女声キーの歌をオクターブを下げての運用するという点においていえば

 「男声音源では最低でもG3を録っておいた方がいい」

 ということになるでしょう。


 ※下方向の劣化を意識するのであれば2, 3音下げても良いと思います。


1.2 音階の遷移の傾向

 これは、ある音階からある音階への遷移を集計した図です。

 小さくて見づらいですが、

 例えば 60 (= C4) から 62 (=D4)へ移動した回数が 804 回だった。という図です。

 (drive で共有した方がいいかな・・・?)


 例として、67(G4) についてクローズアップして考察してみます。

 この行の合計値は 8081 なので、

 2017 / 8081 = 0.249... という算数から、

 (G4) → (G4) と移動する確率は 25 % くらいということが分かります。


 ここで 「UTAUにおいて、全音階程度の合成変形は誤差」 だということを考えると、

 全音の範囲まで含んで、 (1454 + 834 + 2017 + 634 + 1559) / 8081 = 0.804...

 つまり (G4くらい) → (G4くらい) と移動する確率は 80 %という風に考えることができます。


 これを逆に捉えて、

 「20 % くらいの登場頻度の音素の為だけに、音階を変動させる音源を録るのか?」

 ということを考えたかったのです。


 そして、ここで次回解説する予定の新しく制作したリスト 「頻度重み順 CV-VC(V)」 に繋がります。

 これは、質と量のバランスを備えたリストになっています。

Files

Comments

No comments found for this post.