sd-webui-stablesr/README_CN.md

5.8 KiB
Raw Blame History

StableSR - Stable Diffusion WebUI

Licensed under S-Lab License 1.0

CC BY-NC-SA 4.0

English | 中文

  • StableSR 是由 Jianyi Wang 等人提出的强力超分辨率项目。
  • 本仓库将 StableSR 项目迁移到 Automatic1111 WebUI。

相关链接

点击查看大量官方示例!

如果你觉得这个项目有帮助,请给我和 Jianyi Wang 的仓库点个星!


使用

1. 安装

方法 1: URL 安装

installation

方法 2: 施工中...

安装成功后,你能在 img2img 最底下的Scripts下拉列表中看到 "StableSR"。

2. 下载主要组件

  • 你必须使用来自 StabilityAI 的 Stable Diffusion V2.1 512 EMA 模型(大约 5.21GB
    • 你可以从 HuggingFace 下载
    • 放入 stable-diffusion-webui/models/Stable-Diffusion/ 文件夹
  • 下载提取出的 StableSR 模块(大约 400MB

3. 可选组件

  • 安装 Tiled Diffusion & VAE 扩展
    • 原始的 StableSR 对大于 512 的大图像容易出现 OOM。
    • 为了获得更好的质量和更少的 VRAM 使用,我们建议使用 Tiled Diffusion & VAE。
  • 使用官方 VQGAN VAE大约 700MB

4. 扩展使用

  • 在 WebUI 的顶部,选择你下载的 v2-1_512-ema-pruned 模型。
  • 切换到 img2img 标签。在页面底部找到 "Scripts" 下拉列表。
    • 选择 StableSR 脚本。
    • 点击刷新按钮,选择你已下载的 StableSR 检查点。
    • 选择一个放大因子。
  • 上传你的图像并开始生成(无需提示也能工作)。

5. 跑图提示

  • 推荐使用 Euler a 采样器。步数 >= 20。
  • 如果生成图像尺寸 > 512我们推荐使用 Tiled Diffusion & VAE否则图像质量可能不理想VRAM 使用量也会很大。
  • 这里有一些 Tiled Diffusion 设置,可以复制官方的结果。
    • 方法 = Mixture of Diffusers
    • 隐空间Tile大小 = 64隐空间Tile重叠 = 32
    • Tile批大小尽可能大直到差一点点就炸显存为止。
    • Upscaler必须选择None。
  • 什么是 "Pure Noise"
    • Pure Noise也就是纯噪声指的是从完全随机的噪声张量开始而不是从你的图像开始。这是 StableSR 论文中的默认做法。
    • 启用这个选项时,脚本会忽略你的重绘幅度设置。产出将会是更详细的图像,但也会显著改变颜色和锐度。
    • 禁用这个选项时脚本会开始添加一些噪声到你的图像。即使你将去噪强度设为1结果也不会那么的细节但可能更和谐好看。参见 对比图
    • 如果禁用Pure Noise推荐重绘幅度设置为1

6. 重要问题

为什么我的结果和官方示例不同?

  • 这不是你或我们的错。
    • 如果正确安装,这个扩展有与 StableSR 相同的 UNet 模型权重。
    • 如果你安装了可选的 VQVAE整个模型权重将与融合权重为 0 的官方模型相同。
  • 但是,你的结果将不如官方结果,因为:
    • 采样器差异: -官方仓库进行 100 或 200 步的 legacy DDPM 采样,并使用自定义的时间步调度器,采样时不使用负提示。
      • 然而WebUI 不提供这样的采样器,必须带有负提示进行采样。这是主要的差异。
    • VQVAE 解码器差异:
      • 官方 VQVAE 解码器将一些编码器特征作为输入。
      • 然而,在实践中,我发现这些特征对于大图像来说非常大。 (>10G 用于 4k 图像,即使是在 float16)
      • 因此,我移除了 VAE 解码器中的 CFW 组件。由于这导致了对细节的较低保真度,我将尝试将它作为一个选项添加回去。

许可

此项目在以下许可下授权:

CC BY-NC-SA 4.0

免责声明

  • 此扩展中的所有代码仅供研究目的。
  • 严禁贩售代码和权重

产出图像的重要通知

  • 请注意NVIDIA SPADE 模块中的 CC BY-NC-SA 4.0 许可也禁止把产生的图像用于商业用途。
  • Jianyi Wang 可能会将 SPADE 模块更改为商业友好的一个,但他很忙。
  • 如果你希望加快他的进度请通过电子邮件与他联系iceclearwjy@gmail.com

致谢

感谢 Jianyi Wang 等人提出的 StableSR 方法