【AIイラスト】これがこう!おすすめ学習モデルと設定 (Pixiv Fanbox)
Content
2月になりましてこんにちは!
スタジオ真榊です。先日公開した記事「【AIでFANBOX】支援金は〇十万円、スタジオ真榊活動報告」は予想外に大きな反響があり、記事中で紹介したジャーナリストの新清士さんにもTwitterでご紹介いただくなど(!)多くの方に読んでいただけたようで喜んでいます。
一方で、1月中の完成を目指していた「#寝取られ妻のビフォーアフター」は残念ながら2月にずれ込むこととなってしまいました。その理由は、学習モデルの研究とクォリティーUPの実験によって、もともと製作していたページと整合性が取れないほどイラストの質感がアップしてしまったことにあります。いったん学習モデルとレシピを確定させないと、絵柄が不安定すぎて100ページの間に大混乱を呼んでしまうので、先行して絵柄の確定を急いでいたんですよね。
←NAI時代 / ローカル導入後→
現時点で左のNAIタッチと右のローカルタッチが混在している状態にあり、一つ一つクォリティーアップを測っている段階です。このたびようやく理想の絵柄が健全・NSFWそれぞれに固まってきたので、2月の一発目更新では普段どんな設定でイラスト生成をしているかご紹介したいと思います。
SFW(健全):7thAnime v3-A
配布元:7thAnime v3-C
漫画「メイドインアビス」の深界7層から名付けられた、5ch発の階層別マージモデル。「realistic」などと指定しない場合、デフォルトの絵柄がアウトラインのついたアニメ調になるのが特徴。A~Cのモデルが用意されており、Aがリアル寄り、Bが中間、Cがアニメ・イラスト寄りの塗りになる。影があまり派手にグラデーションしない「パキッ」としたアニメ塗りになるので、あとから顔などの加工がしやすい(塗りがグラデーションしていると加筆部分が目立つので手を入れにくくなる)。
メイドさんガチャシリーズはこのモデルの単一プロンプトで製作しました。Cはキャラクターの顔立ちにロリっぽい風味が出てしまうので、「Aでも十分アニメっぽい」という理由でAを愛好しています。
一方で苦手なのは、男性器や男女の絡みなどのモロなnsfw表現。とたんに局部がうすぼんやりとしたイラストになってしまいます(ガッツリ描かれてもどうせモザイク入れるのですが笑)。エロが得意かどうかはマージされた学習モデルによるので、nsfwイラストを作る場合は後述の学習モデルと使い分けています。
▼モデル開発者のおすすめ設定
CFG Scale : 7(いじっても±5程度とのこと、賢木は7で固定)
Sampler : DPM++ 2M Karras
Steps : 25(こちらも固定)
ネガティブプロンプト: (worst quality:1.4), (low quality:1.4) , (monochrome:1.1)が基本。開発者はネガティブプロンプトをできるだけ少なくするよう求めており、実際にこれ以上増やすと破綻しやすくなるので注意。ネガティブプロンプトを盛り盛りに増やすほど画質向上を測れたNAI的思考は一旦捨てて、キャラ固定のために容姿の特徴を2、3入れる程度にしよう。
hires.fix設定:特に指定なし。賢木はアップスケーラーを「Latenet」にし、ノイズ除去強度「0.7」で2倍サイズにする設定を愛好しています(上の綾香も同じ設定)
NSFW(えちち):AbyssOrangeMix2
配布元:AbyssOrangeMix2
こちらも5ch発で、「アビス」の語源も同じ。色々ごたごたがあったAnything v3の絵柄を継承しつつ、無修正画像から学習したとされるエロ特化モデル「Gape60」をマージしたことで、エロ方面の描写が得意になったモデルです。エロ要素をしっかり入れつつ品質の低劣化も防ぐギリギリのバランスが成立しているところがお気に入りポイント。
過去作品で言うと、バニーさんシリーズがこちらのモデルで生まれています。デフォルトの塗りはAnything v3に準拠しており、「パキッ」とした7thAnime v3のCに比べるとだいぶ「ふわっ」とした水彩塗り寄りの表現になるのが特徴。
さきほどの綾香を同一SEED・同一プロンプトで生成するとこんな感じ(▲)。どちらもhires.fixを0.7と強めに掛けているので顔や髪が似た感じの塗りになっていますが、hires.fixなしだと…▼
これくらいはっきりと塗りに差が出ます。プロンプトによっては、顔立ちも含めて7thAnime v3との絵柄の距離が離れすぎるので、プロンプトに「flat color」を入れたり、ネガティブに「realistic」などを入れたりすることで調整が必要になってきます。ちなみに色合いの濃さが似ているのは、どちらも純正品のvaeではなく、waifu diffusion1.4のkl-f8-anime2.ckptを使っているからです。
モデル開発者のおすすめ設定
VAE: orangemix.vae.pt(賢木は上記の別vaeを利用)
CFG Scale : 5 または 6(いじっても4~8程度とのこと、賢木は7固定)
Steps : 本番は20以上、絵柄模索のためのテストなら12以上
ネガティブプロンプト:7th anime v3と同様、「なるべくシンプルが良い。(worst quality, low quality:1.4)で始めるように」とのこと。
サンプラー:「DPM++ SDE Karras」がおすすめ(賢木はDPM++ 2M Karrasを愛好)
アップスケーラー : Latenet (nearest-exact)がおすすめ ※hires.fixをオンにしたときに選べるアップスケール(解像度アップ)の手法のこと。
ノイズ除去強度:0.5がおすすめ(これもhires.fixの設定。0.7超だと元の絵から変貌しすぎ、0.45 未満の場合ブロックノイズが発生する。賢木は0.65を使うことが多いが、指が破綻しがち)
ちなみに、本稿のタイトル画像の3つのイラストのうち、左はNovelAIで全く同じプロンプト・Seedで生成したもの。NAIの名誉のために言っておきますが、NAI式のプロンプト記述でネガティブプロンプト盛り盛りにすればもっと綺麗な綾香になりますよ!
終わりに
そんなわけで、ローカルを始めてまだ半月程度の賢木が現時点で愛好しているモデルと設定についてのご紹介でした。今月のFANBOXは「AI漫画を描こう!最初に習得すべきCLIP STUDIOの基本」につづく中編「ネクストステップへ!最速で中級者になれるクリスタAI漫画術(仮題)」や作品の進捗報告、bad promptやhires.fixの紹介、そして「エロも行ける!ローカル版プロンプト辞典」の投稿などを引き続き行っていきたいと思います。今月は完成へ向けて最後の追い込みをしていく予定ですが、完成のめどが経ったらAIイラストのエロ動画化にも挑戦してみたいですね。ぜひお楽しみに!
東京は2月に入って少し寒さも和らいできた感触がありますが、皆様はいかがでしょうか。賢木は家族から風邪を移されてしまってゲホゲホいっていますが、今月もなんとか頑張っていきたいと思います。会社がないと製作がはかどる…
それでは皆様、楽しいAI生活を♥ スタジオ真榊でした。