とりあえず動かすまで
環境構築(Windows)
インストール
コマンドプロンプトで
git clone https://github.com/bmaltais/kohya_ss.git cd kohya_ss setup.bat
途中でWindowsがフリーズしたかと思うくらい重くなるが触らず我慢。
セットアップ
setup.bat を実行する
コンフィグ
途中で
Do you wish to use FP16 or BF16 (mixed precision)?
と聞かれるのでFP16を選択しておく
終わったら、一旦コマンドプロンプトに戻る。
bitsandbytes をインストールする
kohya_ss\venv\Scripts pip install --use-pep517 --upgrade -r requirements.txt
あとは gui.bat を起動すればOK
起動
gui -listen=0.0.0.0 --headless --share
LoRA作成
以下の手順で行う
- 学習させたい対象データの用意(10枚程度~)
- それぞれの画像に対するタグ付け(ツールである程度雑多にタグ付けされる)
- 不要なタグを精査
- 学習(12枚、1200回、RTX2060で20分程度)
学習元データをフォルダに入れておく
学習させたいデータを、「画像1枚あたりの学習回数_単語 プロンプト」 というフォルダに入れておく
例)初音ミクの画像を100回学習させたい場合 100_hatsunemiku girl
学習させる回数は、1600÷画像の枚数 回くらいで良い
いつものLoRAを使うときは
<lora:hatsunemiku:1>,hatsunemiku,girl
こんな感じになる。
学習
以下の通り
ベースとなるモデルを選択。
配布するつもりなら、stable-diffusion-v1-5にしておくのが無難。
各種フォルダの設定。
あとは「Start training」をクリック。
GUI側に特に完了したとかメッセージは出ないので、コマンドライン画面を見ながらエラーが出ないことをお祈り。寒風の中、滝行をしながらお祈りすると成功率が上がるとか上がらないとか。
コメント