你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

使用托管计算微调模型(预览版)

重要

本文中标记了“(预览版)”的项目目前为公共预览版。 此预览版未提供服务级别协议,不建议将其用于生产工作负载。 某些功能可能不受支持或者受限。 有关详细信息,请参阅 Microsoft Azure 预览版补充使用条款

了解如何在 Azure AI Foundry 中使用托管计算微调和部署模型。 调整训练参数(学习速率、批大小、纪元)以优化性能。

微调相关任务的预先训练模型比从头开始训练新模型更有效。

使用门户中的微调设置来配置数据、计算和超参数。 训练完成后,可以评估和部署生成的模型。

在这篇文章中,你将学会如何:

  • 选择基础模型。
  • 配置计算和数据拆分。
  • 安全地调整超参数。
  • 提交和监视微调作业。
  • 评估和部署微调的模型。

先决条件

注释

必须对此功能使用 基于中心的项目 。 不支持 Azure AI Foundry 项目 。 请参阅 如何知道我拥有哪种类型的项目?创建基于中心的项目

  • Azure 基于角色的访问控制 (Azure RBAC) 用于授予对 Azure AI Foundry 门户中的操作的访问权限。 若要执行本文中的步骤,必须为用户帐户分配 Azure 订阅的“所有者”或“参与者”角色。 有关权限详细信息,请参阅 Azure AI Foundry 门户中基于角色的访问控制

使用托管计算微调基础模型

小窍门

由于可以在 Azure AI Foundry 门户中 自定义左窗格 ,因此你可能会看到与这些步骤中显示的项不同。 如果未看到要查找的内容,请选择 ... 左窗格底部的更多内容。

  1. 登录到 Azure AI Foundry

  2. 如果你尚未进入项目,请选择它。

  3. 在左侧窗格中选择“微调”

    1. 选择 “微调模型 ”,并添加要微调的模型。 本文使用 Phi-3-mini-4k-instruct 进行说明。
    2. 选择“下一步”以查看可用的微调选项。 某些基础模型仅支持“托管计算”选项。
  4. 或者,可以从项目的左侧栏中选择“模型目录”,并找到要微调的基础模型的模型卡。

    1. 在模型卡上选择“微调”以查看可用的微调选项。 某些基础模型仅支持“托管计算”选项。

    屏幕截图:Azure AI Foundry 中适用于基础模型的微调选项。

  5. 选择 托管计算。 这将打开 基本设置

配置微调设置

在本部分中,你将完成使用托管计算为模型配置微调的相关步骤。

  1. 提供模型名称(例如 phi3mini-faq-v1)。 选择下一步,以进行计算

  2. 选择 GPU VM 大小。 确保所选 SKU 的配额。

    屏幕截图:用于微调的计算设置。

  3. 选择“ 下一步以获取训练数据。 任务类型可能是预设的(例如 聊天完成)。

  4. 提供训练数据(上传 JSONL/CSV/TSV 或选择已注册的数据集)。 平衡示例以减少偏见。

  5. 选择“下一步”获取验证数据。 保留 自动拆分 或提供单独的数据集。

  6. 任务参数选择“下一步”。 调整纪元、学习速率、批大小。 从保守开始;根据验证指标进行迭代。

  7. 选择“下一步”进行审阅。 确认计数和参数。

  8. 选择 “提交 ”以启动作业。

监视和评估

  • 在微调作业列表中跟踪作业状态。
  • 查看日志,了解预处理或分配问题。
  • 完成后,查看生成的评估指标(如果已启用),或运行单独的评估比较基准模型与微调模型。

部署微调模型

从作业摘要进行部署。 使用部署名称,例如 faq-v1。 记录模型版本和数据集哈希,以便重现。 添加跟踪以监视实际请求。

Troubleshooting

問题 原因 Action
卡在队列中 GPU 容量不足 尝试替代 SKU 或地区
快速过度拟合 过多的纪元/小数据集 减少纪元或展开数据
无指标改进 数据集干扰/未对齐目标 优化标记或指标选择
部署后延迟较高 较大规模的基础模型/适配器负载 考虑较小的基本模型或调整批大小