2024.11.08 2024.11.29

画像の生成について

shige

Stable Deffusionでは以下の２つのいずれかの方法で画像を生成します。

テキスト（プロンプト）を入力して画像を生成する（txt2img）。

既存の画像を基にして新しい画像を生成する(img2img)。

それぞれ詳しく説明します。

txt2img（テキストから画像へ）

txt2imgは、テキストの記述に基づいて画像を生成する機能です。あなたが入力したテキストをもとに、関連する画像を生成することができます。

この機能は、特定の説明やシナリオに合わせた画像を作成するのに適しています。例えば、特定の風景やオブジェクト、シーンを描写したい場合などに有用です。

img2img（画像から画像へ）

img2imgは、既存の画像を基にして新しい画像を生成する機能です。このプロセスでは、元の画像のスタイルや内容を一部変更して、新しい画像を作り出します。

既存の画像を変更したり、改善したりするのに適しています。例えば、画像のスタイルを変えたり、特定の要素を追加・削除したりする場合に使用されます。

txt2imgはランダム生成が得意、img2imgは複製なんだけど元の画像とちょっと違う生成が得意という認識です。

私は主にtxt2imgで出力し、変更などはControlNet（コントロールネット）を使用しています。ControlNetを使うことで、img2imgのようなこともできますし、例えば512ピクセル×512ピクセルの画像を引き伸ばして高画質にすることもできます。

img2imgは主にバッチ処理（同じ動作を繰り返すこと）に利用しています。何十枚、何百枚の画像を繰り返し高画質化してくれるので助かっています。時間はかかりますが、こちらは作業完了まで待つだけです。

バッチ処理についてはこちらのサイトで詳しくまとめてくれています。

ですので、txt2imgの利用率が圧倒的に高いです。

生成する画像によって使い方も異なりますので、みなさんもいろいろと試してもらえたらと思います。

ABOUT ME

不要な画像の部分削除は「Lama Cleaner（ラマクリーナー）」１択！