stable-diffusion-aws-extension/docs/zh/user-guide/dreambooth-guide.md

2.9 KiB
Raw Blame History

使用Dreambooth进行云上模型训练

您可以打开Dreambooth标签页,通过结合使用Dreambooth原生区域及解决方案新增面板Amazon SageMaker Inference,实现调用云上资源的Dreambooth云上模型训练工作。

创建模型

  1. 打开Dreambooth标签页,模块Model的标签页Create From CloudCreat model tab

  2. Name文本框输入所需创建模型名称。

    !!! Important "提示" 请注意命名格式要求,只能包含字母数字和“-”。

  3. Source Checkpoint下拉列表选择一个checkpoint文件。

补充: 此处checkpoint文件包含两个来源的文件一是以local开头的是本地存储的checkpoint文件另一是以cloud开头的是存储在S3上的checkpoint文件。首次使用建议选择local checkpoint文件。

  1. 点击Create Model From Cloud按钮,开始创建模型。Model Creation Jobs Details区域会即时增加本次模型创建的工作状态。当状态变成Complete,即完成模型创建。

训练模型

  1. 打开Dreambooth标签页,模块Model的标签页Select From Cloud

  2. 刷新Model列表,选择需要训练的模型。

  3. Input模块设置相应的参数。

    • 设置训练参数
      • 勾选Lora可以加速训练过程。
      • Training Steps Per Image (Epochs) 代表了单张图片训练的迭代次数,可以使用默认值。 Input setting
    • 设置需要训练的概念。总共可以设置四个概念,我们以第一个概念为例。
      • Dataset Directory 处填写训练所需的图片路径可以是web server上的路径也可以是s3路径s3路径可以从AWS Dataset Management中上传数据后获取或者自行上传s3后获取需以s3://开头。
      • Training Prompts 下的 Instance Prompt 处填写概念的关键词关键词用于后续txt2img中生成本次训练所产生的概念因此不要是常见的英文单词会和基础模型中的其他概念混淆Input concepts
    • 需要选择将模型保存到子目录 Save Checkpoint to Subdirectory
    • 如果需要单独保存lora模型(这样模型文件会比较小,但需要配合SD基础模型使用),请勾选Generate lora weights for extra networksInput saving
  4. 点击SageMaker Train,启动模型训练任务。Training Job Details区域会即时增加本次模型训练的工作状态。当状态变成Complete,同时您部署解决方案时预留的邮箱将会收到邮件通知,即完成模型训练。

  5. 后续工作。可以进入txt2img标签页的Amazon SageMaker Inference面板,刷新Stable Diffusion Checkpoint,即可看到已训练好的模型。