管理负责任的生成式 AI 解决方案

已完成

映射潜在危害后,制定一种方法来衡量其存在情况,并在解决方案中实施缓解措施,即可准备好发布解决方案。 在这样做之前,有一些注意事项可以帮助你确保成功发布,并顺利进行后续操作。

完成预发布评审

在发布生成 AI 解决方案之前,请确定组织和行业的各种合规性要求,并确保适当的团队有机会查看系统及其文档。 常见的合规性评审包括:

  • 法律
  • 隐私
  • 安全性
  • 可及性

发布和运营解决方案

成功发布需要一些规划和准备。 遵循以下指南:

  • 设计一个 分阶段交付计划,使你能够最初向受限用户组发布解决方案。 使用此方法,你可以在向更广泛的受众发布之前收集反馈并识别问题。
  • 创建 事件响应计划,其中包括对意外事件做出响应所花费的时间的估计。
  • 创建 回滚计划,用于定义在事件发生时将解决方案还原到以前的状态的步骤。
  • 在发现有害系统响应时,实施能够立即阻止的功能。
  • 实现在系统滥用时阻止特定用户、应用程序或客户端 IP 地址的功能。
  • 实现用户提供反馈和报告问题的方法。 具体而言,允许用户将生成的内容报告为“不准确”、“不完整”、“有害”、“冒犯性”或其他有问题的内容。
  • 跟踪遥测数据,使你能够确定用户满意度并确定功能差距或可用性挑战。 收集的遥测应遵守隐私法和你自己的组织对用户隐私的策略和承诺。

使用 Azure AI Foundry 实现内容安全

多个 Azure AI 资源使用内容筛选器提供对它们使用的内容的内置分析,包括语言、视觉和 Azure OpenAI。

Azure AI Foundry 内容安全提供了更多功能,侧重于保持 AI 的安全并避免风险。 这些功能包括检测来自输入或生成的不当或冒犯性语言,以及检测有风险或不适当的输入。

Foundry 内容安全性中的功能包括:

功能 / 特点 功能性
提示防护 扫描用户输入攻击语言模型的风险
有据性检测 检测文本响应是否基于用户的源内容
受保护材料检测 扫描已知版权内容
自定义类别 定义任何新模式或新兴模式的自定义类别

有关使用 Foundry 内容安全的详细信息和快速入门,请参阅该服务 的文档页