LoRA作成忘備録

とりあえず動かすまで

環境構築(Windows)

コマンドプロンプトで

git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
setup.bat

途中でWindowsがフリーズしたかと思うくらい重くなるが触らず我慢。

setup.bat を実行する

コンフィグ

途中で

Do you wish to use FP16 or BF16 (mixed precision)?

と聞かれるのでFP16を選択しておく

終わったら、一旦コマンドプロンプトに戻る。
bitsandbytes をインストールする

kohya_ss\venv\Scripts
pip install --use-pep517 --upgrade -r requirements.txt

あとは gui.bat を起動すればOK

gui -listen=0.0.0.0 --headless --share

以下の手順で行う

学習させたいデータを、「画像１枚あたりの学習回数_単語プロンプト」というフォルダに入れておく

例）初音ミクの画像を100回学習させたい場合
100_hatsunemiku girl

学習させる回数は、1600÷画像の枚数回くらいで良い

いつものLoRAを使うときは

<lora:hatsunemiku:1>,hatsunemiku,girl

こんな感じになる。

以下の通り

ベースとなるモデルを選択。
配布するつもりなら、stable-diffusion-v1-5にしておくのが無難。

各種フォルダの設定。

あとは「Start training」をクリック。
GUI側に特に完了したとかメッセージは出ないので、コマンドライン画面を見ながらエラーが出ないことをお祈り。寒風の中、滝行をしながらお祈りすると成功率が上がるとか上がらないとか。