你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Important
仅为方便起见,提供非英语翻译。 请参阅 EN-US 版本以获取最终版本的此文档。
本文详细说明您提供给 Azure AI Foundry 中 Azure Direct Models 的数据是如何被处理、使用和存储的。 Azure Direct Model 是指在 Azure AI Foundry 中指定并部署为“Azure 直接模型”的 AI 模型,包括 Azure OpenAI 模型。 Azure Direct Models 存储和处理数据,以提供服务并监视违反适用产品条款的用途。 另请参阅 Microsoft产品和服务数据保护附录,该附录管理 Azure Direct Models 的数据处理。 Azure AI Foundry 是一项 Azure 服务; 详细了解 适用的 Azure 合规性产品/服务。
Important
提示(输入)和补全(输出)、嵌入和训练数据:
- 对其他客户不可用。
- 无法供 OpenAI 或其他 Azure 直接模型提供商使用。
- Azure 直接模型提供程序不使用它们来改进其模型或服务。
- 未经您的许可或指示,不得用于训练任何生成 AI 基础模型。
微调的 Azure 直接模型仅供你使用。
Azure AI Foundry 是一项 Azure 服务;Microsoft托管Microsoft Azure 环境中的 Azure Direct 模型,Azure Direct Models 不会与 Azure Direct Model 提供程序运营的任何服务(例如 OpenAI(例如 ChatGPT 或 OpenAI API)进行交互。
Azure AI Foundry 处理哪些数据来提供 Azure 直接模型?
Azure AI Foundry 处理以下类型的数据以提供 Azure 直接模型:
- 提示和生成的内容。 提示由用户提交时,内容由服务通过补全、聊天补全、图像和嵌入操作生成。
- 已上传的数据。 可以使用文件 API 或矢量存储上传自己的数据以用于某些服务功能(例如 微调、 助手 API、 批处理)。
- 有状态实体的数据。 使用 Azure 直接模型和代理的某些可选功能(例如 响应 API、助手 API的线程功能以及存储的完成事件)时,该服务会根据配置功能的方式创建数据存储,用于保存消息历史记录及其他内容。
- 提示中包含或通过提示提供增强数据。 使用与有状态实体关联的数据时,服务将从配置的数据存储中检索相关数据,并增加提示以生成与数据相关的代系。 还可以使用从提示本身中包含的源检索到的数据(例如 URL)来增强提示。
- 训练和验证数据。 你可以提供自己的训练数据,其中包含提示-补全对,用于微调模型。
Azure AI Foundry 如何处理数据以提供 Azure 直接模型?
下图展示了数据的处理方式。 此图涵盖多种处理类型:
- Azure AI Foundry 如何通过使用 Azure Direct Models 进行推理来处理提示以生成内容(包括何时使用 Azure OpenAI 将来自指定数据源的其他数据添加到提示中,以处理数据、助手或批处理)。
- 助手功能如何存储与消息、线程和运行相关的数据。
- 响应 API 功能如何存储数据以持久保存消息历史记录。
- Batch 功能如何处理上传的数据。
- Azure AI Foundry 如何使用上传的数据创建微调的(自定义)模型。
- Azure AI Foundry 和 Microsoft 人员如何分析提示和完成(文本和图像)中是否包含有害内容,以及是否存在违反行为准则或其他适用产品条款的使用模式。
如上图所示,托管客户可以申请修改滥用监视。
通过推理生成补全、图像或嵌入
Azure AI Foundry 资源中部署的 Azure 直接模型(基本或优化)处理输入提示,并使用文本、图像或嵌入生成响应。 客户与模型的交互在逻辑上是隔离和保护的,采用技术措施包括但不限于传输 TLS1.2 或更高版本的加密、计算安全外围、文本的令牌化以及对分配的 GPU 内存的独占访问。 根据配置的阈值,实时评估有害内容类型的提示和完成情况,内容生成会根据配置的阈值进行筛选。 在 内容筛选概述中了解详细信息。
提示和响应在客户指定的 地理位置 内处理(除非你使用的是全局部署类型或 DataZone 部署类型),但出于作目的(包括性能和容量管理)可以在地理位置中的区域之间进行处理。 有关使用全局部署类型或 DataZone 部署类型时处理位置的信息,请参阅下文。
模型是无状态的:模型中不会存储提示或完成项。 此外,提示和完成不会被用于训练、重新训练或改进基本模型。
了解“全局”和“数据区域”部署类型的处理位置
除了标准部署之外,Azure AI Foundry 还提供标记为“Global”和“DataZone”的 Azure 直接模型部署选项。 对于标记为“全局”的任何 部署类型 ,可以在部署相关 Azure Direct 模型的任何地理位置(详细了解 模型的区域可用性)中处理提示和响应。 对于任何标记为“DataZone”的部署类型,可以在 Microsoft 定义的指定数据区域内的任何地理位置处理提示和响应。 如果在位于美国的 Azure AI Foundry 资源中创建 DataZone 部署,则可以在美国的任何位置处理提示和响应。 如果在位于欧盟成员国的 Azure AI Foundry 资源中创建 DataZone 部署,则可以在该或任何其他欧盟成员国中处理提示和响应。 对于全局和 DataZone 部署类型,静态存储的任何数据(如上传的数据)以及为全局部署和 DataZone 部署创建的滥用监视数据存储都存储在客户指定的地理位置中。 仅当客户在 Azure Direct Models 中使用全局部署类型或 DataZone 部署类型时,处理位置才会受到影响;Azure 数据处理和合规性承诺仍然适用。
增强提示以将生成结果“锚定”至“您的数据”上
借助 Azure OpenAI 的“基于你的数据”功能,可以连接数据源,使生成的结果以你的数据为基础。 数据仍存储在指定的数据源和位置中;Azure OpenAI 不会创建重复的数据存储。 收到用户提示时,服务将从连接的数据源中检索相关数据,并增强提示。 模型处理此扩充提示,并返回生成的内容,如上所述。 详细了解 如何安全地使用“On Your Data”功能。
Azure Direct Models 功能的数据存储
某些 Azure 直接模型功能将数据存储在服务中。 这些数据由客户使用文件 API 或矢量存储上传,或者结合某些有状态实体(如响应 API、助手 API 的线程功能和存储补全)自动存储。 为此类功能存储的数据:
- 静态存储在客户 Azure 租户中的 Azure AI Foundry 资源内,并与该资源位于同一地理区域内;
- 默认情况下,始终使用 Microsoft 的 AES-256 加密进行静态加密,并可以选择使用客户管理的密钥(某些预览功能可能不支持客户管理的密钥)。 Microsoft托管密钥始终用于确保所有存储数据的基线加密。
- 可随时由客户删除。
Note
预览版中的模型或功能可能不支持上述所有条件。
存储的数据可用于以下服务特性/功能:
- 创建一个定制化的微调模型。 详细了解 微调的工作原理。 微调模型专供其数据用于创建微调模型的客户使用,在静态时加密(未部署用于推理时),并且可随时由客户删除。 未经许可或说明,为微调上传的训练数据不用于训练任何生成式 AI 基础模型。
- 批处理。 详细了解 批处理的工作原理。 批处理是全局部署类型;静态存储的数据将保留在指定的 Azure 地理位置中,直到处理容量可用;处理可能发生在部署相关 Azure Direct Model 的任何地理位置(详细了解 模型的区域可用性)。
- 响应 API。 详细了解 响应 API 的工作原理。 此 API 存储消息历史记录以及与消息历史记录相关的其他内容。 这是多轮次对话和工作流所必需的。
- 助手 API (预览版)。 详细了解 助手 API 的工作原理。 助手的某些功能,例如线程、存储消息历史记录和其他内容。
- 存储补全(预览版)。 存储补全通过聊天补全 API 存储客户已部署的 Azure OpenAI 模型(如 GPT-4o)的输入-输出对,并在 Azure AI Foundry 门户中显示这些对。 这允许客户使用其生产数据生成数据集,然后可用于评估或微调模型(如适用的产品条款所允许)。
防止滥用
为了降低滥用或有害使用的风险,Azure 直接模型包括滥用监视功能。 若要了解有关滥用监视的详细信息,请参阅 滥用监视。
针对微调模型的安全评估通过使用 Azure 的风险和安全指标来评估微调模型的潜在有害响应。 服务仅记录生成的评估(可部署或不可部署)。
Azure Direct Models 滥用监控系统旨在检测和减轻重复出现的内容和/或行为,这些内容和行为可能表明以违反行为准则或其他适用产品条款的方式使用该服务。 如此处所述,系统采用算法和启发式方法来检测潜在的滥用指标。 检测到这些指标后,可以选择客户提示和完成情况的示例进行评审。 评审由自动化方式进行,包括默认情况下由 LLM 等 AI 模型进行,并根据需要由人工审阅者进行其他评审。 滥用监视中提供了有关自动评审和人工评审的详细信息。
为了自动评审,客户的提示和完成不会由系统存储,也不会用于训练 AI 模型或其他系统。 用于存储提示和完成以供人工审查的滥用监控数据存储根据客户资源进行了逻辑上的分隔(每个请求都包含客户 Azure AI Foundry 资源的资源 ID)。 在每个 Azure Direct Model 可用的地理区域中,都有一个独立的数据仓储。客户的提示和生成的内容存储在客户 Azure AI Foundry 资源部署所在的 Azure 地理区域内,并位于 Azure Direct Models 服务边界之内。 只有当数据已经被滥用监视系统标记,或者提示语和补全是潜在滥用模式的一部分时,评估潜在滥用的人工审查员才能访问提示语和补全数据。 人工审查者是经过授权的 Microsoft 员工,他们使用请求 ID、安全访问工作站 (SAW) 和团队经理授予的实时 (JIT) 请求审批,通过逐点查询来访问数据。 对于部署在欧元区的 Azure 直接模型,经授权的Microsoft员工位于欧元区。
如果客户已批准进行修改的滥用监视(在 滥用监视中了解详细信息),则不会执行上述数据存储和人工评审过程。 然而,仍然可以进行自动审查,利用包括 AI 模型在内的算法,在提供了提示语或生成了补全时(视具体情况而定)对其进行审查。 如果此类自动审查检测到客户订阅中可能指示严重或定期滥用的内容,则客户可能会受到访问限制,如“负责使用 Microsoft AI 服务的产品条款”中所述。 可能还会要求客户同意启动包含人工审核的滥用监控,以降低将来访问受限的风险(例如,检测到滥用行为的帐户或订阅可能会受到限速和/或暂停)。
Note
Azure 预览版功能(包括预览版中的 Azure 直接模型)可能采用不同的隐私做法,包括滥用监视。 预览版可能受补充条款的约束: Microsoft Azure 预览版的补充使用条款。
防止有害内容生成
Azure 直接模型包括一个系统,旨在检测和防止输出有害内容。 若要了解有关内容筛选的详细信息,请参阅 内容筛选。
当服务处理提示生成内容时,内容筛选会同步进行,如上文和 此处所述。 没有提示或生成的内容存储在内容分类器模型中,在未经许可或说明的情况下,不会使用提示和输出来训练任何生成式 AI 基础模型。
客户如何验证用于滥用监控的数据存储是否关闭?
客户有两种方法,一旦批准关闭滥用监视,即可验证滥用监视的数据存储是否已在其批准的 Azure 订阅中关闭:
- 使用 Azure 门户,或
- Azure CLI(或任何管理 API)。
Note
仅当禁用用于滥用监视的数据存储时,“ContentLogging”属性的“false”值才会显示。 否则,此属性将不会显示在 Azure 门户或 Azure CLI 的输出中。
Prerequisites
- 登录 Azure
- 选择托管 Azure AI Foundry 资源的 Azure 订阅。
- 导航到 Azure AI Foundry 资源的 “概述 ”页。
- 使用 Azure 门户
- 使用 Azure CLI(或其他管理 API)
转到“资源概述”页
单击右上角的 JSON 视图 链接,如下图所示。
“Capabilities”列表中将有一个名为“ContentLogging”的值,当关闭用于滥用监视的日志记录时,该值将显示并设置为 FALSE。
{
"name":"ContentLogging",
"value":"false"
}
若要详细了解Microsoft的隐私和安全承诺,请参阅 Microsoft信任中心。
更改日志
| Date | Changes |
|---|---|
| 2025 年 10 月 3 日 | 扩展文档至 Azure 直接模型;分离了内容筛选和滥用监控部分;增加了有关滥用监控以及严重或重复滥用行为的澄清。 |
| 2024 年 12 月 17 日 | 添加了与新的存储完成功能相关的数据处理和存储的信息;添加了语言澄清,预览版中的 Azure OpenAI 功能可能不支持所有数据存储条件;删除了批处理的“预览”指定 |
| 2024 年 11 月 18 日 | 添加了有关新“数据区域”部署类型中数据处理位置的信息;添加了有关新的 AI 提示和生成结果审查的信息,作为防止滥用和生成有害内容的一部分。 |
| 2024 年 9 月 4 日 | 添加了有关新功能数据处理的信息(并相应地修改了现有文本),包括助手 API(预览版)、Batch(预览版)和全局部署;根据 Azure 数据驻留原则,修订了与数据处理位置相关的语言:添加了有关数据处理的信息,以便对微调模型进行安全评估;阐明了与使用提示和完成相关的承诺;次要修订以提高清晰度 |
| 2023 年 6 月 23 日 | 添加了有关新的 Azure“基于你的数据”功能的数据处理的信息;删除了有关滥用监视的信息,这些信息现在可以在 Azure OpenAI 服务滥用监视中查看。 添加了摘要说明。 更新和简化了内容,并更新了图表以提高清晰度。 添加了更改日志 |