43 lines
2.9 KiB
Markdown
43 lines
2.9 KiB
Markdown
# 使用Dreambooth进行云上模型训练
|
||
您可以打开**Dreambooth**标签页,通过结合使用**Dreambooth**原生区域及解决方案新增面板**Amazon SageMaker Inference**,实现调用云上资源的**Dreambooth**云上模型训练工作。
|
||
|
||
|
||
## 创建模型
|
||
|
||
1. 打开**Dreambooth**标签页,模块**Model**的标签页**Create From Cloud**。
|
||

|
||
2. 在**Name**文本框输入所需创建模型名称。
|
||
|
||
!!! Important "提示"
|
||
请注意命名格式要求,只能包含字母数字和“-”。
|
||
|
||
3. 在**Source Checkpoint**下拉列表,选择一个checkpoint文件。
|
||
> **补充:** 此处checkpoint文件包含两个来源的文件:一是以local开头的是本地存储的checkpoint文件,另一是以cloud开头的是存储在S3上的checkpoint文件。首次使用建议选择local checkpoint文件。
|
||
|
||
4. 点击**Create Model From Cloud**按钮,开始创建模型。**Model Creation Jobs Details**区域会即时增加本次模型创建的工作状态。当状态变成**Complete**,即完成模型创建。
|
||
|
||
|
||
|
||
|
||
## 训练模型
|
||
1. 打开**Dreambooth**标签页,模块**Model**的标签页**Select From Cloud**。
|
||
2. 刷新**Model**列表,选择需要训练的模型。
|
||
3. 在**Input**模块设置相应的参数。
|
||
- 设置训练参数
|
||
- 勾选*Lora*可以加速训练过程。
|
||
- *Training Steps Per Image (Epochs)* 代表了单张图片训练的迭代次数,可以使用默认值。
|
||

|
||
- 设置需要训练的概念。总共可以设置四个概念,我们以第一个概念为例。
|
||
- *Dataset Directory* 处填写训练所需的图片路径,可以是web server上的路径也可以是s3路径,s3路径可以从**AWS Dataset Management**中上传数据后获取或者自行上传s3后获取,需以s3://开头。
|
||
- *Training Prompts* 下的 *Instance Prompt* 处填写概念的关键词,关键词用于后续txt2img中生成本次训练所产生的概念,因此不要是常见的英文单词(会和基础模型中的其他概念混淆)。
|
||

|
||
- 需要选择将模型保存到子目录 **Save Checkpoint to Subdirectory**。
|
||
- 如果需要单独保存lora模型(这样模型文件会比较小,但需要配合SD基础模型使用),请勾选**Generate lora weights for extra networks**。
|
||

|
||
|
||
4. 点击**SageMaker Train**,启动模型训练任务。**Training Job Details**区域会即时增加本次模型训练的工作状态。当状态变成**Complete**,同时您部署解决方案时预留的邮箱将会收到邮件通知,即完成模型训练。
|
||
5. 后续工作。可以进入**txt2img**标签页的**Amazon SageMaker Inference**面板,刷新**Stable Diffusion Checkpoint**,即可看到已训练好的模型。
|
||
|
||
|
||
|