LoRA作成忘備録

とりあえず動かすまで

お試しで作ったLoRAで出力した「ずんだもん」

環境構築(Windows)

インストール

コマンドプロンプトで

git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
setup.bat

途中でWindowsがフリーズしたかと思うくらい重くなるが触らず我慢。

セットアップ

setup.bat を実行する

コンフィグ

途中で

Do you wish to use FP16 or BF16 (mixed precision)?

と聞かれるのでFP16を選択しておく

終わったら、一旦コマンドプロンプトに戻る。
bitsandbytes をインストールする

kohya_ss\venv\Scripts
pip install --use-pep517 --upgrade -r requirements.txt

あとは gui.bat を起動すればOK

起動

gui -listen=0.0.0.0 --headless --share

LoRA作成

以下の手順で行う

  1. 学習させたい対象データの用意(10枚程度~)
  2. それぞれの画像に対するタグ付け(ツールである程度雑多にタグ付けされる)
  3. 不要なタグを精査
  4. 学習(12枚、1200回、RTX2060で20分程度)

学習元データをフォルダに入れておく

学習させたいデータを、「画像1枚あたりの学習回数_単語 プロンプト」 というフォルダに入れておく

例)初音ミクの画像を100回学習させたい場合
100_hatsunemiku girl

学習させる回数は、1600÷画像の枚数 回くらいで良い

いつものLoRAを使うときは

<lora:hatsunemiku:1>,hatsunemiku,girl

こんな感じになる。

学習

以下の通り

ベースとなるモデルを選択。
配布するつもりなら、stable-diffusion-v1-5にしておくのが無難。

各種フォルダの設定。

あとは「Start training」をクリック。
GUI側に特に完了したとかメッセージは出ないので、コマンドライン画面を見ながらエラーが出ないことをお祈り。寒風の中、滝行をしながらお祈りすると成功率が上がるとか上がらないとか。

コメント

タイトルとURLをコピーしました