現状3000×3000ドットの画像をStable Diffusionで作るのはビデオメモリの関係で難しいので、768×768の画像を作って、それを数倍に拡大し指定サイズに縮小する方法を取ります。
必要なツール
- Real-ESRGAN
- ImageMagick
Real-ESRGAN
このメージに行ってポータブル版をダウンロードしてくる
ここからダウンロードしてZIPファイルを適当な場所に展開しておく。
筆者の環境では
D:\Tools\realesrgan\realesrgan-ncnn-vulkan.exe
にインストールされた
Image-Magick
コマンドラインで色々画像処理が出来るツール
コマンドプロンプトを開いて、
winget install ImageMagick.ImageMagick
と入力すればインストールが完了する。
インストール場所は
C:\Program Files\ImageMagick-7.1.1-Q16-HDRI\magick.exe
ベースとなる画像を作る
Stable Diffusionのプロンプトに
Colorful gradients, swirls, crazy tones, and splatters of paint
とだけ入力して画像を作りました。
RTX3060だと1500×1500までは一気に画像を作れますが、拡大するので750×750でも良いです。
ただ16の倍数に丸められるので適当でもOK
最終的にこんな画像が出来ました
ここに曲タイトルやアーチスト名を入れますが、拡大縮小する前にいれると文字が粗くなってしまいますので、先に画像のみ3000×3000になるように処理します。
実行
Pathを通さず、バッチファイル化するつもりなのでツールへの場所はフルパスで記載した
"D:\Tools\realesrgan\realesrgan-ncnn-vulkan.exe" -i input.png -o output.png -n realesr-animevideov3 -s 4
"D:\Tools\realesrgan\realesrgan-ncnn-vulkan.exe" -i output.png -o output.png -n realesr-animevideov3 -s 4
"C:\Program Files\ImageMagick-7.1.1-Q16-HDRI\magick.exe" output.png -thumbnail "3000x3000" output.png
input.pngの解像度が小さい場合、
"D:\Tools\realesrgan\realesrgan-ncnn-vulkan.exe" -i output.png -o output.png -n realesr-animevideov3 -s 4
をもう一度くらい繰り返しても良い
とにかくImageMagickで縮小する前に、3000×3000以上の画像ができていればOK
入稿サイズは 3000×3000 ~ 6000×6000ドットまで
背景画像が出来たら
使い慣れたグラフィックソフトか、CanvaかExcel(ぉぃ!)でも何でも良いですが、
今どきのペイントブラシはレイヤーが使えるので簡単に文字入れが出来ます。
コメント