2.9 KiB

Raw Blame History

使用Dreambooth进行云上模型训练

您可以打开Dreambooth标签页，通过结合使用Dreambooth原生区域及解决方案新增面板Amazon SageMaker Inference，实现调用云上资源的Dreambooth云上模型训练工作。

创建模型

打开Dreambooth标签页，模块Model的标签页Create From Cloud。
在Name文本框输入所需创建模型名称。

!!! Important "提示" 请注意命名格式要求，只能包含字母数字和“-”。
在Source Checkpoint下拉列表，选择一个checkpoint文件。

补充： 此处checkpoint文件包含两个来源的文件：一是以local开头的是本地存储的checkpoint文件，另一是以cloud开头的是存储在S3上的checkpoint文件。首次使用建议选择local checkpoint文件。

点击Create Model From Cloud按钮，开始创建模型。Model Creation Jobs Details区域会即时增加本次模型创建的工作状态。当状态变成Complete，即完成模型创建。

训练模型

打开Dreambooth标签页，模块Model的标签页Select From Cloud。
刷新Model列表，选择需要训练的模型。
在Input模块设置相应的参数。
- 设置训练参数
  - 勾选Lora可以加速训练过程。
  - Training Steps Per Image (Epochs) 代表了单张图片训练的迭代次数，可以使用默认值。
- 设置需要训练的概念。总共可以设置四个概念，我们以第一个概念为例。
  - Dataset Directory 处填写训练所需的图片路径，可以是web server上的路径也可以是s3路径，s3路径可以从AWS Dataset Management中上传数据后获取或者自行上传s3后获取，需以s3://开头。
  - Training Prompts 下的 Instance Prompt 处填写概念的关键词，关键词用于后续txt2img中生成本次训练所产生的概念，因此不要是常见的英文单词（会和基础模型中的其他概念混淆）。
- 需要选择将模型保存到子目录 Save Checkpoint to Subdirectory。
- 如果需要单独保存lora模型(这样模型文件会比较小,但需要配合SD基础模型使用)，请勾选Generate lora weights for extra networks。
点击SageMaker Train，启动模型训练任务。Training Job Details区域会即时增加本次模型训练的工作状态。当状态变成Complete，同时您部署解决方案时预留的邮箱将会收到邮件通知，即完成模型训练。
后续工作。可以进入txt2img标签页的Amazon SageMaker Inference面板，刷新Stable Diffusion Checkpoint，即可看到已训练好的模型。

2.9 KiB Raw Blame History Unescape Escape

使用Dreambooth进行云上模型训练

创建模型

训练模型

2.9 KiB

Raw Blame History