画像生成AI「Stable Diffusion」とは?

Stable Diffusion(ステーブルデフュージョンと言います)は、AIを活用した画像生成ツールの一つで、テキスト(プロンプトとも言います)や画像で指定した内容をもとに、それを視覚的なイメージに変換します。
この技術は、学習した大量の画像とテキストのデータをもとに、テキストの指示に従った画像を「生成」します。つまり、「プーサイドに座った水着を着た綺麗なお姉さん」というような文を入力すると、AIはその情景を学習データから想像して、それに合った画像を作り出すわけです。
生成AIの面白いところは、ただ単に画像を生成するだけではなく、その生成過程で「創造性」を発揮する点です。
例えば、同じテキストを何度か入力しても、毎回微妙に異なる画像が出てきます。
これは、AIがテキストの解釈にある程度の「自由度」を持っているからで、だからこそ、あなたは一つのテキストから無限に近いバリエーションの画像を得ることができるんですね。
また、Stable Diffusionは、その名の通り「安定した拡散」を意味していて、画像の品質が一定以上を保ちつつ、多様な画像を生成する能力を持っています。これにより、クリエイティブな作業を行う人々にとって、新たなインスピレーションの源となり得るわけです。
ただし、このような技術は、使い方によっては著作権や倫理的な問題を引き起こす可能性もあるため、利用する際には注意が必要です。AIが生成する画像は、学習したデータベースに基づいているため、既存の作品と似たような結果が出ることもあり得えます。
特にLora(ローラ)という学習データを利用することで、ある特定のキャラクターを生成することも可能です。
ですから、Stable Diffusionを使う際には、その点を念頭に置いて、他者の著作物には敬意を払い、創造性を尊重する心構えが大切だと言えるでしょう。
また、商用利用可能であるか否かも注意する点です。学習モデルや、Lora によっては商用利用が不可なものもありますので、自分だけで生成して楽しむだけであれば問題ないですが、それを販売すると規約違反になりますので注意してください。
利用している学習モデルについては別の記事でご紹介しています。