Stable Diffusion
利用法
オンライン
オフライン
StableSwarmUI
2024/06/21以降、Stability AIによって管理されなくなっています。Stability-AI/StableSwarmUI: StableSwarmUI, A Modular Stable Diffusion Web-User-Interface, with an emphasis on making powertools easily accessible, high performance, and extensibility.
【Stable Diffusion】StableSwarmUIとは?インストール方法や基本的な使い方について - イクログ
Fooocus
【西川和久の不定期コラム】次世代Stable Diffusion(SDXL)をWindows上で一発で使用可能にする「Fooocus」 - PC Watch 西川和久 (2023/08/16)
バージョン
SD 1.5 (Stable Diffusion 1.5)
SDXL (Stable Diffusion XL)
Stability AI、画像生成モデルSDXL 1.0をリリース、オープンモデルとして公開 | gihyo.jp (2023/07/27)
Announcing SDXL 1.0 — Stability AI
技術
構成要素
| |
|
| VAE |
|
| U-Net |
潜在表現を受け取り、そこから逆方向の拡散プロセス (ノイズを除去して画像を生成するプロセス) の何らかの段階で使われるノイズの残差の潜在表現を推測する |
| テキストエンコーダー |
Hugging Faceで公開されているStable Diffusion with Diffusersというドキュメントを基にした情報 |
「Stable Diffusion」でノイズから画像が生成される過程を確認しよう:Stable Diffusion入門(1/2 ページ) - @IT かわさきしんじ (2022/09/30)
潜在拡散モデル (latent diffusion model)
拡散モデル (diffusion model) をより効率的にしたものです。
拡散モデルと潜在拡散モデルはどちらも基本的な考え方は同じで、純粋なノイズから少しずつノイズを取り除いていくことで、最終的に何らかの画像を得るというものです。
誰もが知っておくべき画像生成AI「Stable Diffusion」の仕組みと使い方:Stable Diffusion入門 - @IT かわさきしんじ (2022/09/16)
高速化
- TensorRT
- SSD-1B
- LCM (Latent Consistency Model for Stable Diffusion)
- LCM LoRA (Latent Consistency Model LoRA)
【西川和久の不定期コラム】Stable Diffusion高速化の決定版登場!?品質落とさず制限もほぼなしで2~3倍速に - PC Watch 西川和久 (2023/11/20)