Stable Diffusion

Free AI Image Generator

3258

269

访问官网

价格类型免费

支持平台 Web

支持语言英文

开发公司 Stability AI

更新时间 2025-11-03 08:38

标签

文生图

工具介绍

Stable Diffusion 简介

Stable Diffusion 是由 Stability AI 主导开发的一款开源深度学习模型，专注于文本到图像（Text-to-Image）生成。它基于 潜在扩散模型（Latent Diffusion Model, LDM），通过逐步去噪的方式将随机噪声转化为符合文本描述的高质量图像。该模型于 2022 年 8 月 发布，凭借其开源特性、高效计算（可在消费级 GPU 上运行）和高度可控的生成能力，迅速成为 AI 绘画领域的标杆工具之一。

与 Midjourney 等闭源工具不同，Stable Diffusion 允许用户本地部署、自定义模型，并支持多种衍生应用（如图像修复、风格迁移等）。其核心开发团队包括 Stability AI、CompVis（慕尼黑大学研究组）和 Runway，并得到 LAION 数据集的支持。

核心功能

文本生成图像（Text-to-Image）
输入文本提示（如“星空下的未来城市，赛博朋克风格”），生成 512×512 或更高分辨率（如 768×768、1024×1024）的图像。支持调整参数（如采样步数、引导强度）以优化生成效果。
图像编辑与增强
图生图（img2img）：基于现有图像生成新变体，例如修改风格或添加元素。内补绘制（Inpainting）：局部修复或替换图像中的特定区域。外补绘制（Outpainting）：扩展图像边界，填充合理内容。
高级控制与定制
支持负面提示词（Negative Prompt）排除不想要的元素（如畸形手脚）。可加载社区训练的专用模型（如动漫风格、写实摄影等）。
跨领域扩展
除图像生成外，还可用于视频修复、音频生成等任务。