Home Artists Posts Import Register

Content

こんばんは、みなとです

そういえばというか、自分で「制作過程の音源等の情報をお見せします」とか書いていて、全くそうしてなかったので記事を書いています。


今作ってる音源なんですが、とりあえず英語音源で、リストまでとりあえず作れたんですね。

んで、特にまだ収録出来たりとかしたわけではないので、(なので


この記事を下まで見てもとくに音声とかあるわけじゃないです


)正直ここから録音してみたら「実は全くうまくいかなったので、全部ボツ!」とかになることもあるかなーと思ったりとかで記事にする必要も無いかなと思ったんですが、最初に書いたように「制作過程の音源等の情報をお見せします」というのをするのをすっかり忘れてたな、と。


リストはARPASingというやつを噛み砕いたものです。

読める英単語だけで出来た英語音源。

以前


とツイートしたやつをそのまま実行に移しまして

リスト作りにめげそうと言ってしまったら、なんか沢山favももらえてしまったので張り切れてしまいました。


そして、リストの方を作るのに、結構めんどうなこと…いや全然難しいことをしたというより単に時間が掛かって大変というだけですが、を色々して、あれをする為のこれをする為のどれをする為の…ということが起きてしまって。

その経緯の説明用の、公開用のFANBOXの方をめちゃくちゃ書き込んでる最中にこの、制作過程の云々を見て思い出してこの記事を書いています。(3回目)

(図もあるので、文字数を書いてもしょうがないので、ためしに記事をスクショすると画像サイズがどうなるかで言うんですが、縦が12,000ピクセルくらいになってます。誰が全部読むんだよ、と)


どう面倒なことになったかだいたいいうと、(だいたい、なのは、もう向こうの記事で一部始終書いてるからです。もしポシャったら・・・・ポシャらないといいなあ…)まず英単語を適当に集めてリストを作って、それで英単語からリストを作るわけですから、欲しい発音から英単語を探す為のなんかスクリプトみたいなのが欲しいわけです。

んで、Ctl+Fでピンポイントでその単語に飛ぶんじゃなくて、「これらがその発音を含む英単語ですよー」という一覧、が作れるものが欲しくなるわけです。…①


んで、それローカルで動くC#とか、なんかPythonとかで書いても良かったとは思いますが、まず、そもそも既存のARPASingリストの問題点は「はい!ver0.2.0のリスト公開です!!!」→「…(そのまま音沙汰なし。※SynthesizerVの開発に行ってしまったので)」というところです。


「そのリストがどういう手法で作られた」とか、「なぜこの音素が選ばれた/省かれている」とか、一切オープンじゃなくmoresamplerのアップデート放置と同時にフワッとなくなってしまいました。

後続の人が、発音のやり方を汲み取って抜けを補完したリストを作ったりされていましたが、公式のリストデータの配布に使われていたなんかアップロードする為のサイトが消えて、なんかもうぐちゃぐちゃです。

(実際「UTAU English reclist」で検索するとどこにもたどり着けません)


そもそもまぁ、今からARPASingを録ろうという人もいない「すごいと言われてたけど、箱を開けてみたら実は結構欠陥(発音抜け)のあるリストだった。」という過去のものとして忘れされていってる状況ではあります。

歌声AIも出てきてる関係で、そっちの方が英語歌えるじゃん。みたいな感じの。


でも結局のところ、結局1ユーザーが英語の歌を作ろうとしたときに、自由に使えるような感じのものが手元まで降りてきてはいないのですよね、と。

じゃあーーーー自分でリスト作るしかないですよね、と。

(まぁ、最近の声質変換AIを使って、英語を合成できるSynthesizerVで歌わせたのを変換すればいいじゃん、ってなるかもしれんですが、思ったよりも元の歌手に寄ってしまいます。具体的にいうと、人によって子音の長さ違うじゃないですか、それをその変換AIはピッタリ合わせてくれてしまうので、まず発音の癖が元歌手に影響されます。まぁあくまで1:1で変換してくれるので当たり前です。

次に、そもそも元の音源(元の人間)に無い音はそのAIでも合成がうまくできません。あー訂正します。なんか想像できそうな範疇なら出来ます。例えば、「あ→えの音があれば、英語のaeって合成できない?」っていう問題は解決できます。でも例えば、「小籠包」これを中国語で言ったときに「xiǎolóngbāo」となりますが、概ねこの「lóng」がうまく発音できません。具体的にどんな感じに合成されるかというと「ろん」か「rn--」とか「ろー」になります。正解なのは鼻母音で「ん」とは言いません。よくわかりませんね。まぁそもそも自分でも正確に発音できるわけじゃないんですが。余談でした。)


じゃあリストを改めて作るぞ!となった場合にどうなるか、といったら、一番重要なのは、最後まで録りきれそうだな、というモチベーションが無くならないことです。

そうです、リストの最適化ではなくモチベーションが無くならないことです。

まぁもちろん最適化もしないと、簡単だったとしても「2000個録ってね」はこころが折れます。

それなんで、一発で読める簡単な英単語を、一つずつ手動で選んで追加していってリストを作るというとても地道なことをしました……


そして、その地道な作業をどうやったかといえば、ARPASingの発音記号を入力すると、辞書からその一覧を出してくれるウェブページを作った、ということです。(これが①です)

そして、ここで『「そのリストがどういう手法で作られた」とか』に繋がります。

Javascriptで動くウェブページを公開することによって、このリストのここの発音が足りないから追加したい、というのをするのも(比較的)簡単に行うことができるようになります。

そもそもその公開するリストに含まれてないCV音とVC音もあるので、これがこういう理由で含まれてないです、という旨もそのFANBOX記事に書きました。

し、その網羅度をスプレッドシートで行列表として視覚的に見ることができるようにもウェブページを作りました。

(まぁそもそもこれもないとあなぬけを埋める作業ができなかったわけですが)

し、英単語を入れるとARPABetになって、moresampler用の自動設定用のcsvのテキストが出力されて、UTAU用のリストが出力されるウェブページも作りました。

(※)

まぁもっとも、自力でイケてるウェブページが作れたら色々困ってはいなんで、およそ90%はChatGPTに書いてもらったコードで出来てるんですがね!HAHAHA


そういうわけでぐちゃぐちゃと話しましたが、英語音源用のリスト作りをするために必要な小道具を作ったり、リスト作成自体も頑張りました、という話でした。

まぁ、実際に録音してこの世に具体例として、歌わせたのを公開できないと意味ないんですがね~~~……😭

Comments

No comments found for this post.