Stable Diffusion

利用法

オンライン

オフライン

StableSwarmUI

2024/06/21以降、Stability AIによって管理されなくなっています。Stability-AI/StableSwarmUI: StableSwarmUI, A Modular Stable Diffusion Web-User-Interface, with an emphasis on making powertools easily accessible, high performance, and extensibility.

【Stable Diffusion】StableSwarmUIとは?インストール方法や基本的な使い方について - イクログ

Fooocus

【西川和久の不定期コラム】次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」 - PC Watch 西川和久 (2023/08/16)

バージョン

SD 1.5 (Stable Diffusion 1.5)

SDXL (Stable Diffusion XL)

Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開 | gihyo.jp (2023/07/27) Announcing SDXL 1.0 — Stability AI

技術

構成要素

   
VAE  
U-Net 潜在表現を受け取り、そこから逆方向の拡散プロセス (ノイズを除去して画像を生成するプロセス) の何らかの段階で使われるノイズの残差の潜在表現を推測する
テキストエンコーダー Hugging Faceで公開されているStable Diffusion with Diffusersというドキュメントを基にした情報
「Stable Diffusion」でノイズから画像が生成される過程を確認しよう:Stable Diffusion入門(1/2 ページ) - @IT かわさきしんじ (2022/09/30)

潜在拡散モデル (latent diffusion model)

拡散モデル (diffusion model) をより効率的にしたものです。

拡散モデルと潜在拡散モデルはどちらも基本的な考え方は同じで、純粋なノイズから少しずつノイズを取り除いていくことで、最終的に何らかの画像を得るというものです。

誰もが知っておくべき画像生成AI「Stable Diffusion」の仕組みと使い方:Stable Diffusion入門 - @IT かわさきしんじ (2022/09/16)

高速化

  • TensorRT
  • SSD-1B
  • LCM (Latent Consistency Model for Stable Diffusion)
  • LCM LoRA (Latent Consistency Model LoRA)
【西川和久の不定期コラム】Stable Diffusion高速化の決定版登場!?品質落とさず制限もほぼなしで2~3倍速に - PC Watch 西川和久 (2023/11/20)