スタジオ真榊

【追加学習入門】LoRAを使ったキャラ再現に挑戦しよう！ (Pixiv Fanbox)

Published:

2023-04-20 11:00:00

Edited:

2024-02-01 01:23:38

Imported:

Content

「AIイラスト術天下一武道会」エントリー作品

寄稿者：ふしめろさん

はじめに

この記事は、AIであるGPT-4によって生成されています。

こんにちは、ふしめろです！今回は、僕が支援しているスタジオ真榊さんが面白そうな企画をしているのを見かけたので、みんなにもシェアしようと思って記事を書くことにしました。

ちなみに、最近AIアートの入門書を書いて、Kindleで配信しているんだ。もし興味があれば、ぜひ合わせてチェックしてね。きっと理解が深まると思うよ！

AIアートを楽しもう！: はじめてのStable Diffusion初心者向け創作ガイド

さて、今回のテーマは、その入門書にも書いた、追加学習とLoRAについてざっくり解説することにするよ。

まず、追加学習っていうのは、AIが既に学んだ知識をベースに、新しい情報を学習することなんだ。これでAIはどんどん賢くなっていくんだよ。

そして、LoRAとは、上に書いたAIに新しい概念を学習させる手法の1つで、既存のモデルに新しい概念を取り入れやすくする方法なんだ。これがあると、AIの学習がもっとスムーズになるんだよね。

僕が書いたAIアート入門書とスタジオ真榊さんがFANBOXで紹介しているたくさんの魅力的な情報を組み合わせればAIアートを楽しく学べるようになると思うよ。ぜひ、みんなもスタジオ真榊さんのFANBOXをチェックしてみてね！

LoRAとは

みんな、LoRAって言葉、聞いたことある？実は、AIに新しい概念を学習させる手法の1つなんだよ！

まず、AIは通常、既存のモデルをベースに、たくさんの画像を学習させて新しい概念を身につけるんだ。ただ、そのままだと容量が大きいモデルをいくつも用意しないといけないから使いにくいって問題があるの。

そこで、LoRAが登場！追加したい新しい概念だけを軽量な別のファイルに出力し、生成時に必要に応じて参照することで、使いやすさがアップするんだよ。

ゲームの例で分かりやすく説明すると、既存のモデルがゲーム本体で、LoRAがMOD（追加コンテンツ）みたいな役割を果たしているんだ。MODはいくつあってもいいけど、ゲーム本体をいくつも持ってるのは面倒くさいよね。LoRAを使うことで、新しい概念を活用した画像生成ができるようになるんだ。

だから、LoRAはAI学習の革新的な手法で、今人気の学習方法なんだよ！

理解できればこれからのAIアートの世界が、もっと面白くなること間違いなし！

ここから先は学習ソフトの導入方法と、学習方法、使い方の3つに分けて説明していくね！

導入方法

LoRAの学習を始めるためには、6GB以上のVRAMを持つGPUが必要だよ。例えば、RTX3060 12GBを搭載したPCであれば大丈夫だね。それじゃあ、早速手順をフレンドリーに解説していくよ！

1 まず、「LoRA_Easy_Training_Scripts」と検索して、GitHubのページを開いてね。ページ内の右にある「release」ボタンを押してね。

2 Release一覧から、「installers v5」内にある「install_sd_scripts_v5.bat」をダウンロードしよう。

もしわからなかったら、こちらのURLを開いてね。

3 新しいフォルダを作って、ダウンロードした「install_sd_scripts_v5.bat」を置いておこう。

4 「install_sd_scripts_v5.bat」を実行しよう。完了まで少し時間がかかるけど、ゆっくり待ってね。途中で、英語でRTX30X0かRTX40X0どちらかをインストールしているかどうか聞かれるから、ちゃんと答えておいてね。

5 導入が完了すると、「LoRA_Easy_Training_Scripts」というファイルができるよ。

これで導入は完了だね！ただ、「LoRA_Easy_Training_Scripts」は英語で書かれているから、使いやすいように日本語化をしたものを用意しておいたよ。こちらのURLで配布しているから、ぜひチェックしてみてね。

学習について

AI学習を始める前に、手順をしっかり理解しておくことが大切だよね。だから、今回は学習に取り組む前にやっておきたい事前準備と、手順を順番に解説していくよ。最後まで読んでから取り組むと、スムーズに進めることができるよ！

ただ、情報は時々変わることがあるから、もし不明な点があれば、外部サイトを参照することをおすすめするね。

事前準備

1. 覚えさせたい画像を用意しよう。できるだけ多くて、画質が良いものがいいね！

2. 「stable-diffusion-webui-wd14-tagger」をWebUIに導入しておこう。次のリンクを拡張機能に導入してね：

https://github.com/toriato/stable-diffusion-webui-wd14-tagger

3. 「BooruDatasetTagManager」をダウンロードしておこう。拡張機能じゃないから注意だよ。こちらのリンクからダウンロードできるよ。

これで事前準備は完了だね！次は学習に取り組む時の手順を順を追って解説していくよ。頑張ってね！

タグ付け・タグ編集

1. まず、下記の画像のようなファイル構造を作成しよう。

2. 覚えさせたい画像を「0_gazo」フォルダに入れてね。

3. 画像を入れた後、「0_gazo」フォルダの名前を変更しよう。これからはこのフォルダを「画像フォルダ」と呼ぶことにするね。

・「0」は繰り返し回数、「gazo」は呼び出し用プロンプトの名前だよ。

・繰り返し回数×画像枚数で1エポック分の学習ができるよ。例えば、20枚の画像が「50_gazo」に入っていたら、1000ステップ＝1エポックになるね。

・今回の例では、後で説明するタグ「goshidore」を使って呼び出し用プロンプトを設定するよ。

・繰り返し回数は、1500÷画像枚数を基準にして、出力結果に応じて増減させるといいね。今回は46枚の画像を使うから、「35_goshidore」と名前を変えるよ。

4. 事前準備で「stable-diffusion-webui-wd14-tagger」を導入している場合、WebUIの「タグ付け」タブ→「ディレクトリから一括処理」タブを開いて、入力ディレクトリに画像フォルダを指定しよう。

5. インタロゲーターを「wd-14convnext」に設定して、「アンダースコアの代わりにスペースを使用する」「括弧をエスケープする」にチェックを入れよう。

6. インタロゲートボタンを押して、処理が終わるのを待とう。

7. 処理が終わったら、「BooruDatasetTagManager」を起動して、ファイルメニューから開くと、画像とタグが読み込まれるよ。

8. タグの編集を行おう。ゴシックドレスちゃんのタグを参考にして説明するね。

chichi-pui ゴシックドレスちゃん　サンプルふしめろ

まず、「ゴシックドレスちゃん」を表すタグを考えるよ。存在しない英単語の方がいいね。

①ゴシックドレスちゃんのタグ解析をすると、たくさんのタグが出てくるよ。

1girl, long hair, pointy ears, solo, smile, looking at viewer, detached sleeves, navel, sitting, halo, dress, clothing cutout, bare shoulders, open mouth, boots, bangs, navel cutout, black dress, thighhighs, breasts, very long hair, blurry, :d, purple hair, pink eyes, small breasts, knee boots, black footwear, blurry background, collarbone, full body, blush, thighs, black hair, long sleeves, depth of field, black thighhighs, purple eyes, hair between eyes

②「ゴシックドレスちゃん」という概念を考え、要素をピックアップしよう。

【ゴシックドレスちゃんの要素】

・pointy ears, detached sleeves, navel, halo, dress, clothing cutout, bare shoulders, boots, bangs, navel cutout, black dress, thighhighs, very long hair, purple hair, pink eyes, small breasts, knee boots, black footwear, collarbone, long sleeves, hair between eyes, black thighhighs,

【ゴシックドレスちゃん以外の要素】

・1girl, long hair,solo, smile, looking at viewer, sitting, open mouth, breasts, blurry, :d, blurry background, full body, blush, thighs, black hair, depth of field, purple eyes,

今回の目的は、「goshidore」にゴシックドレスちゃんの要素をまとめることだね。だから、「①ゴシックドレスちゃんの要素」で列挙したタグをすべて削除して、「goshidore」を先頭に配置しよう。

③最終形態

・goshidore, 1girl, long hair,solo, smile, looking at viewer, sitting, open mouth, breasts, blurry, :d, blurry background, full body, blush, thighs, black hair, depth of field, purple eyes,

これで、削除したタグの要素が「goshidore」にまとめられるよ。

タグ付けがよくわからない場合は、以下のサイトも参照してみてね。