你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
重要
仅为方便起见,提供非英语翻译。 请参阅 EN-US 版本以获取最终版本的此文档。
内容理解基于文档智能、语音转文本、图像分析、人脸、视频和 Azure OpenAI 的功能,每个功能的核心是符合性、隐私和安全性。 这项综合服务能够处理客户提供的各种类型数据,例如文档、音频、图像、生物特征数据(人脸)、文本和视频,从而提供强大的数据分析和智能处理能力。 重要的是,用户负责确保其使用此服务符合其管辖范围内的所有适用法律和法规,包括数据保护、隐私和通信法律,以及利用面部识别功能时有关生物识别数据的任何特定要求。 对于提交用于处理的内容和数据,务必获得所有必要的许可、授权或第三方权限。
由于此集成服务中处理的数据可能涉及个人或敏感信息,包括生物识别标识符和人类语音内容,因此用户必须遵循与数据保护相关的所有管辖权要求。 例如,在使用生物识别技术时,必须向用户清晰、明确地披露相关信息,尤其是在对生物识别数据管理有严格规定的地区。 存储并处理提供给 Azure OpenAI 服务的数据,以监视产品条款的符合性, Microsoft的产品和服务数据保护附录 适用于 Azure OpenAI 框架中的所有数据处理。 通过结合这些技术,我们的服务提供了可靠的见解,同时确保用户对遵守法律和法规标准负责。
内容理解处理哪些数据?
内容理解可以处理音频输入或语音音频、图像文件、文档文件和视频文件。 每个输入类型具有不同的文件限制,例如文件类型、大小、长度和分辨率。 服务 配额和限制文档中概述了这些限制。
内容理解如何处理数据?
身份验证
内容理解首先要求用户使用 Azure AI 服务 API 密钥对内容理解 API 的访问权限进行身份验证。 对服务 URL 的每个请求都必须包含身份验证标头。 此标头传递 API 密钥(或令牌(如果适用),该密钥用于验证服务的订阅。 除了使用 API 密钥进行访问身份验证外,内容理解还支持 Azure Active Directory (Azure AD) 和 Entra ID 身份验证。 更多信息,请参阅“对 Azure AI 服务进行身份验证”,其中包含有关 Azure AD、Entra ID 以及授权访问托管标识的更多信息。
保护传输中的数据
所有 Azure AI 服务终结点都使用 HTTPS URL 在传输过程中加密数据。 客户端作系统需要支持传输层安全性 (TLS) 1.2 来调用终结点。 有关详细信息,请参阅传输层安全性。 传入数据在创建 Azure 资源的同一区域中进行处理。
加密用于处理的输入数据
传入数据在创建内容理解资源的同一区域中进行处理。 将文件提交到内容理解作时,它会开始分析输入的过程。 随后,数据和结果会被临时加密并存储在 Azure 存储中,之后再发送到 Azure OpenAI 进行进一步处理。 虽然计算资源并非专用于每个客户,但系统会通过逻辑隔离的沙盒容器来处理请求,以确保工作负载隔离,并防止跨用户数据泄露。
默认情况下,客户数据在存储时始终使用 Microsoft 的 AES-256 加密技术进行加密,用户也可以选择使用客户管理的密钥(某些预览功能可能不支持客户管理的密钥)。 系统始终使用 Microsoft 管理的密钥来确保所有存储数据的基本加密保护。
检索结果
使用用于调用“分析”操作的相同 API 密钥对“获取结果”操作进行身份验证,以确保其他客户无法访问你的数据。 它返回分析作业完成状态,当状态显示为成功时,该作还会以 JSON 格式返回提取的结果。
数据保留期
输入文档和中间表示仅在处理期间写入由 Microsoft 托管的安全存储,并在操作完成后即被删除。 输出结果最多保留 24 小时,以支持异步检索,之后它们会自动删除。 记录分析器名称以供报告和调试。
区域进程
即使是临时存储,数据也不会被存储在用户为内容理解资源所选择的区域之外。 但是,根据 OpenAI 可用性,未来我们可能会将流量路由到同一地理位置的另一个区域。
人脸
人脸识别是处理生物特征数据的一项封闭功能。 我们检测输入文件中的人脸,并按它们的相似性对其进行分组。 所有中间数据在处理请求结束后都不会被保留。 除非用户显式删除人脸数据,否则与分析结果关联的人脸分组将保留 48 小时。 有关详细信息,请参阅“人脸数据和隐私”文档。
Azure OpenAI
在每个模态输入通过基础 AI 服务处理后,内容理解还会利用 Azure OpenAI 模型。 有关详细信息,请参阅“Azure OpenAI 数据、隐私和安全文档”。