你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI Foundry 模型的默认防护措施和控制策略

Azure AI Foundry 模型对所有模型应用默认安全,不包括在 Foundry 模型中的 Azure OpenAI 中的低音模型等音频模型。 默认情况下,这些配置会提供负责任的体验。

默认安全性旨在缓解仇恨和公平、性、暴力、自我伤害、受保护材料内容和用户提示注入攻击等风险。 若要了解有关内容筛选的详细信息,请阅读 风险类别和严重性级别

本文介绍默认安全配置。

小窍门

默认配置适用于所有模型。 但是,可以按模型部署配置内容筛选,如 如何配置内容筛选器中所述。

文本模型

Azure AI Foundry 模型中的文本模型可以采用并生成文本和代码。 这些模型应用 Azure 的文本内容筛选模型来检测和防止有害内容。 此系统同时适用于提示和补全。

风险类别 提示/完成 严重性阈值
仇恨和公平性 提示和补全 中等
暴力 提示和补全 中等
提示和补全 中等
自残 提示和补全 中等
用户提示注入攻击(越狱) 提示语
受保护材料 – 文本 补全
受保护材料 – 代码 补全

视觉和与视觉模型聊天

视觉模型可以同时将文本和图像作为输入的一部分。 默认内容筛选功能因模型和提供程序而异。

Azure OpenAI:GPT-4o 和 GPT-4 Turbo

风险类别 提示/完成 严重性阈值
仇恨和公平性 提示和补全 中等
暴力 提示和补全 中等
提示和补全 中等
自残 提示和补全 中等
个体身份识别和敏感特性推断 提示语
用户提示注入攻击(越狱) 提示语

Azure OpenAI:DALL-E 3 和 DALL-E 2

风险类别 提示/完成 严重性阈值
仇恨和公平性 提示和补全
暴力 提示和补全
提示和补全
自残 提示和补全
内容凭据 补全
政治候选人信息的欺骗性生成 提示语
公共人物刻画 提示语
用户提示注入攻击(越狱) 提示语
受保护材料 – 艺术和工作室字符 提示语
脏话 提示语

除了前述安全配置之外,Azure OpenAI DALL-E 还默认附带提示转换。 这种转换发生在所有提示上,以提高原始提示的安全性,特别是在多元化、政治候选人信息的欺骗性生成、公共人物刻画和受保护材料等风险类别中。

Meta:Llama-3.2-11B-Vision-Instruct 和 Llama-3.2-90B-Vision-Instruct

内容筛选器仅适用于文本提示和完成。 内容审查不适用于图像。

后续步骤