使用 DeepSpeed 的分布式训练

重要

此功能在 Beta 版中。

本页包含使用无服务器 GPU 计算上的 DeepSpeed 进行分布式训练的笔记本示例。

使用 DeepSpeed 和 TRL 进行监督式微调

此笔记本演示如何使用无服务器 GPU Python API 通过具有 DeepSpeed ZeRO 阶段 3 优化的 转换器强化学习(TRL)库 运行监督式微调(SFT)。

Notebook

获取笔记本