Microsoft 365 Copilot 调整允许组织使用自己的租户数据微调大型语言模型 (LLM) 。 这些经过微调的模型电源 代理 可以根据组织的独特知识执行特定于域的任务。 所有训练和 AI 处理都发生在 Microsoft 365 租户中,因此数据保持安全并受现有合规性控制。 结果是 AI 助手的行为类似于专家团队成员,根据组织的内容和规则提供量身定制的帮助。
本文介绍组织如何使用Copilot 调整来创建特定于任务的微调 LLM。 它介绍了用户如何在这些经过微调的模型上生成代理,以及 IT 管理员如何控制该功能。
注意
Copilot 调整目前可用于早期Access 预览版 (EAP) 。 有关要求以及如何注册的详细信息,请参阅 管理员指南。
主要功能和方案
Copilot 调整允许通过直观的无代码 UI 微调 LLM。 业务分析师或主题专家可以使用其领域知识来微调相关租户数据的 LLM,使模型能够了解组织自定义的独特语音和过程。 例如,法律部门分析师可以使用公司过去的案例摘要和模板微调模型,以创建合同起草代理,该代理使用公司独特的风格和术语编写文档。
Copilot 调整提供以下关键功能和优势:
无代码模型微调 - 使用 Microsoft Copilot Studio 中的直观界面微调内部数据的 LLM。
特定于域的代理 - 根据为业务任务定制的微调模型生成专用 Copilot 代理。 可以为专家 Q&A、建议生成或报告摘要等方案创建代理,这些方案的行为与该领域的专家类似。 代理为组织生成具有适当语气、词汇和详细程度的结果。
更直观的见解和自动化 - 将组织的业务知识编码到 Copilot 中,可以针对组织进行分析和内容创建。 代理在几分钟内完成可能需要数天的手动工作 (搜索文档、编译数据、编写草稿) 的任务。 借助这种自动化,分析师和主题专家可以专注于更高价值的工作,同时 Copilot 处理日常或信息密集型任务。
与数据源集成 - Copilot 调整可以使用 Microsoft 365 生态系统中已有的丰富内容。 选择知识源;然后,该模型从此租户数据中学习,以确保代理的响应以组织的信息为基础。 由于 Copilot 与 Microsoft Graph 集成,因此代理还可以对实时企业数据进行推理,从而提供一个强大的工具来查询和汇总来自 Microsoft 365 的最新信息。
组织可以将Copilot 调整用于以下方案:
Q&A - 创建跨 .docx、.pdf 和 .html 等格式的特定于租户的内容(如法规、税法或科学报告)进行理解和推理的域专用代理。 为了反映组织的语气、术语和合规性语言,Q&A 代理提供了子句感知答案、摘要和跨文档比较, (例如,跨区域的法规差异) 。 这些代理针对深度域驱动工作流中的稳定、文本密集型内容进行优化,其中精度和上下文很重要。
文档生成 - 根据文档模板和过去的报表训练模型,以生成复杂文档的初稿,否则这些文档需要多个提示和模型输出。 例如,可以创建一个以公司批准的格式和语气组合销售建议或起草法律合同的建议书编写器代理。
摘要 - 生成反映组织语气、格式和内容优先级的复杂文档的高质量结构化摘要。 摘要代理非常适合大批量或高风险用例(如法律、法规或执行报告),可确保一致性,减少手动工作量,并适应首选摘要样式。 使用示例对训练 LLM,以生成清晰、可作且符合内部标准的摘要。
微调 LLM
若要成功生成捕获组织专业知识的任务特定代理,需要微调 LLM。
应用以下最佳做法来优化 LLM:
从明确的目标开始 - 确定高价值任务,以确保代理提供有形结果,并将时间、数据和精力集中在可带来有意义的回报的工作上。 Copilot 调整目前支持三种主要任务类型:专家 Q&A、文档生成和文档摘要。
策展质量训练数据 - 为任务收集最相关的最新文档。 微调的有效性取决于良好的数据。 使用权威源,例如策略文档、专有报告、批准的模板和反映组织标准、格式和决策逻辑的最终可交付结果。
对于文档生成或摘要等任务,请提供高质量的输入/输出对,以帮助模型了解结构、语气和内容预期。
定义明确的说明和约束 - 在 Copilot Studio 中配置模型时,可以输入代理语气和行为的说明。 提供明确的准则;例如,“使用专业友好的语气”或“仅使用官方 2023 策略手册中的信息”。还可以提供初学者提示或示例问题来指导模型的响应。 这些说明可帮助代理了解上下文和样式。
使用预览和评估工具 - Copilot 调整包括评估步骤。 训练模型后,使用示例查询或任务对其进行测试。 Copilot Studio允许将测试结果与基线答案进行比较。 查看输出以确保它们符合你对准确性和语气的期望。 如果没有,请优化训练数据或说明并重新训练。
使用反馈进行迭代 - 将微调视为迭代过程。 监视代理在使用中的性能。 定期使用新数据或更正更新模型,以确保其准确性。 例如,如果策略发生更改或发现进一步优化的机会,请合并这些更新并运行另一轮微调。
知道何时使用 Copilot 与微调 - 如果你的方案很广泛或信息每天更改,则使用 Copilot 的检索增强生成 (RAG) (在查询时搜索内容)可能就足够了。 微调最适合于模型需要深入了解静态内容或特定样式的明确定义的重复任务。 如果任务依赖于常规引用或轻型合成,请从 Copilot 开始。 如果输出需要反映组织的特定语音、结构或推理(尤其是可重复的高价值任务),则表明需要投入微调。
使用在 LLM 上优化的代理
微调模型后,用户可以使用 Copilot Studio 代理生成器基于该模型创建和部署代理。
用户根据微调的模型与代理进行交互,就像他们与 Copilot 交互一样 - 通过 teams 或其他应用中的Microsoft 365 Copilot 应用或Copilot 对话助手。 他们可以提出自然语言问题,代理会根据其微调的知识做出响应。
基于微调模型的代理为组织提供以下优势:
提高工作效率 - 代理在日常工作中充当智能助手。 用户可以获取即时答案或基于其组织的数据生成内容。 用户还可以依靠代理来生成摘要、分析数据、起草通信等,从而更快地完成任务。
一致性和准确性 - 基于微调模型的代理响应与组织数据一致。 这可以降低由于过时的文档或外部搜索引擎而出错的风险。
解决方案创建 - Copilot 调整使用户能够创建 AI 支持的解决方案,以满足其特定的生产力需求。 这在组织中培养了创新文化。
改进的协作 - 代理提供了一种使组织专业知识可供所有用户使用的方法。 这有助于消除组织中的知识孤岛,并增加信息共享和协作。
基于微调的模型创建代理时,请应用以下最佳做法:
了解模型的范围 - 代理基于哪些数据和任务? 它是否在 2022 年以前接受了人力资源文档培训? 它是否仅用于汇总某些报表? 了解范围有助于提出正确的问题,而不是期望它执行不相关的任务。
提供明确的提示 - 与代理交互时,请提出明确的具体问题。 虽然模型经过微调,但措辞良好的查询会产生更好的结果。 例如,与其问“告诉我有关福利的信息”,不如问“全职员工的产假政策是什么?”微调的代理可以处理复杂的查询,但清晰度有助于它提供更精确的信息。
包括初学者提示 - 初学者提示显示在代理 UI 中,可帮助用户了解代理的功能。 根据微调代理的关键方案定制初学者提示,以帮助用户充分利用代理的知识。
优化和迭代 - 基于微调模型的代理支持多轮对话。 如果代理的响应不完全是你需要的,请优化提示或提出后续问题。 经过微调的代理使用后续问题来调整其响应。
应用安全最佳做法 - 不要要求经过微调的代理提供应保密的信息,并按照组织的策略处理代理响应。
提供反馈以进一步优化代理 - 使用反馈机制训练或调整经过微调的代理以提高其性能。 定期提供反馈有助于代理持续改进。 在 Copilot 中,用户可以选择竖起大拇指和向下大拇指图标,以提交有关代理响应的反馈。 此反馈将发送给Microsoft,帮助产品团队识别常见问题并随着时间的推移提高模型性能。
管理员设置和治理
Copilot 调整提供租户范围的设置、安全性和治理功能,使管理员能够设置环境并设置适当的防护措施。
以下关键管理功能可用于Copilot 调整:
访问控制 - AI 管理员可以为其组织或特定用户子集启用Copilot 调整。 例如,管理员可能仅为 R&D 和法律部门启用Copilot 调整,并指定这些团队中的某些用户来创建微调的模型和专用代理。 训练和部署模型后,AI 管理员控制对已训练模型的访问。
Microsoft 365 管理中心治理 - 管理员可以通过Microsoft 365 管理中心中的 Copilot 管理部分监视微调项目和代理。 他们可以查看部署的自定义模型,并在模型过时时删除该模型。
安全性和合规性 - Copilot 调整是使用企业级安全性构建的。 模型训练发生在租户隔离的环境中,生成的模型继承基础数据的访问权限。 在训练期间,不会将客户数据传输到外部服务;微调发生在与租户关联的安全云中。
Copilot 调整排除应用于模型的安全组或组无权访问的任何文件。 它还建议安全组添加到其训练数据中,以最大化其知识。 此功能为模型提供额外的安全层。
注意
微调模型时,会根据训练数据调整模型权重。 对训练数据的访问权限更改不会自动应用于模型;AI 管理员需要在Microsoft 365 管理中心中更新对模型的权限。
Copilot 响应中返回的任何Microsoft Graph 数据也遵循文档权限;响应不包括用户无权访问的信息。
部署和监视 - 对模型进行微调和部署后,构建者可以在代理中使用它,并与组织中有权访问该模型的用户共享该代理。 管理员可以通过安全组控制谁有权访问代理,并且可以通过 Copilot 使用情况分析仪表板监视代理使用情况。
免责声明
AI 管理员负责确保你使用此产品符合所有适用的数据保护、隐私和知识产权法律。 这包括履行 GDPR 或 CCPA 等法规规定的数据控制者义务。
数据控制者义务
- 你负责如何在租户环境中收集、存储和使用数据。
- 必须确保数据实践符合法律对透明度、同意、访问和删除的要求。
- 在使用之前,你负责验证从此系统生成的任何输出的准确性、适当性和合规性。 可能需要与主题专家一起审查。
版权和模型培训
- 如果选择使用自己的数据训练自定义模型,则必须确保对训练集中包含的任何受版权保护的材料拥有适当的权利或许可证。
- 版权保护不适用于使用未经授权的受版权保护内容训练的模型。 你对任何此类使用承担全部责任。
数据删除
- 如果数据用于训练模型的用户根据 GDPR (或类似法规) 提交有效的删除请求,则需要重新训练模型。
- 微调模型时,会根据训练数据调整模型权重。 可以随时删除微调的模型。