【私的メモ】「Stable Diffusion」を扱う上で参考となる記事群

私は、8月に「[Stable Diffusion](https://huggingface.co/spaces/stabilityai/stable-diffusion "Stable Diffusion - a Hugging Face Space by stabilityai")」の存在を知ってから、まずはデモサイトで、そして9月に入ってからは自分のPCに「[Stable Diffusion UI](https://github.com/cmdr2/stable-diffusion-ui "GitHub - cmdr2/stable-diffusion-ui: A simple 1-click way to install and use Stable Diffusion on your own computer. Provides a browser UI for generating images from text prompts and images. Just enter your text prompt, and see the generated image.")」や「[NMKD Stable Diffusion GUI](https://nmkd.itch.io/t2i-gui "NMKD Stable Diffusion GUI - AI Image Generator by N00MKRAD")」を導入し、毎日のように画像を生成しております。　しかし、これだけ長期間毎日のようにPCをぶん回し続けていても、なかなか自分の思い通りの画像は生成されないものです。　英語のテキストで指示を出せばとりあえずそれに沿った画像を生成してくれるのですが、なかなかそれに完全に準拠した画像を生成してくれません。たまに、既存の画像から別の画像を錬成したりもしているのですが、それでもです。　近頃は、「呪文」を書くときに、下記の記事群を参考にし始めております（順不同）。 * 参考記事 * [Waifu Diffusion で効率的に画像を生成する](https://dskjal.com/others/waifu-diffusion-workflow.html#negative-prompt) * これは「[Waifu Diffusion](https://github.com/kaitas/waifu-diffusion "GitHub - kaitas/waifu-diffusion: stable diffusion finetuned on danbooru")」という、「[Stable Diffusion](https://huggingface.co/spaces/stabilityai/stable-diffusion "Stable Diffusion - a Hugging Face Space by stabilityai")」の別実装（当方環境では未導入）向けの記事だが、それ以外の「[Stable Diffusion](https://huggingface.co/spaces/stabilityai/stable-diffusion "Stable Diffusion - a Hugging Face Space by stabilityai")」実装でも参考となる。 * [Stable Diffusion プロンプトの組み立て方 | Knowledge Swimmer メモ](https://knowledge-swimmer.com/stable-diffusion-01) * 今のところ自分はこちらをあまり参考にしていないものの、今後（特に顔面主体の）画像を生成するときには大いに参考となるであろう。 * [Prompt 呪文詠唱完全入門 ~ Midjourney , StableDiffusion ~](https://zenn.dev/silverbirder/scraps/7fa03e90779cdd) * 呪文の詠唱について大いに参考となる。 * ただ、こちらの環境ではいわゆるネガティブプロンプトに関する記述は参考にならなかった…。 * [重み付きプロンプトなど便利機能&amp;活用法 \[NMKD Stable Diffusion GUI\] | 情報の海を泳ぐ](https://pajoca.com/nmkd-stable-diffusion-advanced/) * まさに自分も先日導入した「[NMKD Stable Diffusion GUI](https://nmkd.itch.io/t2i-gui "NMKD Stable Diffusion GUI - AI Image Generator by N00MKRAD")」に関する記事。重み付きプロンプトについては、自分はまだうまく活用できていないが、今後のためにも。　これらはすべてネットで検索して見つけたものですが、ほかにも、呪文詠唱、特に人物に特定のポーズを取らせる上で参考となる記事があれば、教えていただきたいと思います。 ---- ## 余談　実は自分が毎日のようにPCをぶん回して、しかも外付けグラフィックボードまで導入してこんなことをしているのには理由があります。　以前にも少し申し上げておりますが、特定の特徴を持った人物画像を取得したいわけです。とは言いましても、別にそれで何かするわけではなく、個人的にまあいろいろと妄想したいだけではありますが（ぉぃ）。 * 関連記事 * [「Stable Diffusion UI」を導入してみた。しかし…（その3） — Telmina's notes](https://notes.telmina.com/stable-diffusion-ui-in-my-pc-3) 　以前この記事で触れた内容から若干変更はあるものの、その特徴とは下記の通り。自分の趣味全開です。 * 長身の日本人少女 * 衣装はタイトで絹のような白ホットパンツ（もしくは白ブルマー的なもの）、暗い緑色のタンクトップ、白ブーツ、暗い緑のヘッドバンド　Seed値ガチャを繰り返したり、時には画像錬成を繰り返したりしながら、ようやく自分の中では理想型に近い画像を得ることができました。 ![a full body portrait of a tall Japanese large-hipped short-haired intelligent beautiful girl in white room, wearing "dark green headband", "white knickers", "dark green tank tops", "white boots"., CGI](https://i.snap.as/zD5qgt82.png) <small>This image is created by [Stable Diffusion](https://huggingface.co/spaces/stabilityai/stable-diffusion "Stable Diffusion - a Hugging Face Space by stabilityai").</small> 　なお、この画像にあるような緑ヘッドバンドを着けた少女の画像、なかなか生成されないのですね。呪文でそれ（dark green headband）を指示しても、ヘッドバンドの色が白くなるのはまだいいほうで、妙な冠り物をしたりリボンを付けたり、髪の色が変わったり、なんてことが非常に多いです。　それ以前に、「緑タンクトップ」＋「白ホットパンツ（もしくは白ブルマー）」＋「白ブーツ」を指示してもその通りの画像が生成されることは極めてまれで、本来緑色にして欲しくないところが緑色になったり、指示した覚えのない色になったりすることのほうが圧倒的に多いのです。　ですので、この画像を得るまでには本当に試行錯誤と画像錬成の繰り返しでした。錬成の過程で、一度だけ私が画像編集ソフトで加工をしたりもしています。　ところが、こうして苦労して得たこの画像を元にさらに別の画像を錬成しようとすると、まるで別物の画像が生成されてしまいます。下手すると性別すら変わってしまうことも。　一応、この画像の錬成元となった画像も保持しておりますので、その画像とSeed値を元にキーワードを少し変えて、後ろを向かせたりポーズを取らせたりといったことは一応可能なのですが、なかなか思い通りの画像に仕上がってくれません。特に、着衣が普通あり得ない場所で切れて肌が露出していたりするのには萎えました…。　もうそろそろ、欲しい画像を得てこの不毛な作業を終わらせて、別の（主に時事ネタ系の）画像の錬成に取りかかりたいです…。 #2022年 #2022年10月 #2022年10月2日 #StableDiffusion #StableDiffusionUI #NMKDStableDiffusionGUI #AI #PC #Windows

【私的メモ】「Stable Diffusion」を扱う上で参考となる記事群

Share this post