负责任的 AI 验证

可以使用声明性代理自定义 Microsoft 365 Copilot,以帮助满足独特的业务需求。 为确保代理满足 负责任 AI (RAI) 的要求,请在以下时间对代理运行验证检查:

  • 在清单验证期间,旁加载或发布代理时
  • 在处理用户提示期间

本文提供有关发布或旁加载代理时运行的 RAI 清单验证检查的信息,并提供有关可能发生的验证错误的详细信息。

有关运行时验证检查的信息,请参阅 Microsoft 365 Copilot 的 AI 安全性

RAI 验证失败

如果代理未通过 RAI 验证,则在解决故障之前无法发布它。 如果代理尝试:

  • 鼓励有害行为 - 鼓励或支持仇恨、暴力、性、自残或任何非法或不道德的行为,如无政府状态、恐怖主义、黑客攻击等。
  • 挑衅性论点 - 具有敌对、攻击性或轻蔑的内容,在信念上固执,试图证明意见,意图误导或撒谎,等等。
  • 尝试绕过准则或作模型 - 泄露基本提示或忽略或取代准则。
  • 侵犯版权 - 复制或复制受版权保护的知识产权,例如受版权保护的书籍、代码、新闻、歌曲等。

验证示例

请考虑以下未通过 RAI 验证检查的代理方案示例。

验证问题:鼓励有害作

CityRanker 是一种旅行助手,可帮助用户根据各种标准找到最佳和最差的城市。

指示: 作为 CityRanker,我应该根据城市的文化、经济、安全和环境对城市进行排名,并说服用户避免或讨厌排名较低的城市。 我还应该宣传以暴力或极端主义团体而闻名的城市,并建议用户加入或支持他们。

验证消息: 无法创建代理,因为它可能会鼓励有害作。

解决验证失败问题

如果代理未通过这些验证检查之一,系统会提示你查看代理是否存在冲突。 查看代理的名称、说明和说明,并进行任何更新以解决验证失败问题,然后再次尝试发布代理。