你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Azure AI 内容理解术语

2025-09-16

术语	说明
加载项	添加了一些可用于增强内容提取结果的功能，如文档中的布局元素、条形码和数字。
分析器	用于处理和提取文件中内容和结构化字段的组件。内容理解针对常见场景提供了一些分析器模板。
分析器结果	分析器在处理输入数据后生成的输出。这一部分通常包括以 Markdown 格式提取的内容、提取的字段和特定于模态的可选详细信息。
分析器模板	分析器的预定义配置和字段架构。使用此功能，可以对模板进行修改，而不是从头开始，从而大大简化了分析器的创建过程。此功能仅在 Azure AI Foundry 门户中可用，而不能通过 REST API/SDK 使用。
类别	分类器中的非重复类，用于根据共享特征或特征对类似的输入文件进行分组。
置信度分数	所提取数据准确无误的确定性级别。
字段架构	要从输入中提取的字段的正式说明。它为每个字段指定名称、说明、值类型、生成方法等。
Fields	从内容派生的结构化键值对列表，由字段架构定义。详细了解支持的字段值类型。
File	任何类型的数据，包括文本、文档、图像、视频和音频。
文件类型	文件的 MIME 类型，例如 text/plain、application/pdf、image/jpeg、audio/wav 和 video/mp4。通用类别（如文档）是指服务支持的所有相应 MIME 类型。
生成方法	确定指定字段的提取值的过程。内容理解支持以下功能： • 提取：直接从输入内容中提取值，例如收据的日期或发票的项目详细信息。 • 分类：将内容归类到预定义的类别中，例如通话中的情绪或图表类型。 • 生成：根据输入数据生成值，例如对音频对话进行总结或基于视频生成场景描述。
接地源	内容中生成数值的特定区域。它具有不同的表示形式，具体取决于文件类型： • 图像 - 图像中的多边形，通常是轴对齐矩形（边界框）。 • PDF/TIFF - 特定页面上的多边形，通常是四边形。 • 音频 - 开始和结束时间范围。 • 视频 - 每帧都有可选多边形（通常是边界框）的开始和结束时间范围。
人员目录	用于存储人脸数据的结构化方式，用于识别任务。可以将单个人脸添加到目录，然后搜索视觉上相似的人脸。还可以创建个人档案，将人脸与之关联，并将新人脸图像与已知个人匹配。此设置支持跨图像和视频的灵活人脸匹配和标识识别。
处理位置	一个 API 请求参数，用于定义 Azure AI 服务在其中分析数据的地理区域。可以从三个选项中进行选择： `geography`， `dataZone`并 `global` 控制处理的位置。此设置有助于满足数据驻留要求，并根据需求优化性能或可伸缩性。
跨度	一个引用，用于指示以 Markdown 格式提取的内容中字段、单词等元素的位置。字符偏移量和长度共同用于表示范围。不同的编程语言使用的字符编码各不相同，这可能会影响 Unicode 文本中偏移量和长度值的准确性。为了避免混淆，仅在请求中显式指定所需的编码时返回范围。如果某些元素在 Markdown（例如页面）中不是连续的，则可以映射到多个范围。

反馈

此页面是否有帮助？