你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure AI 内容理解术语

术语 说明
加载项 添加了一些可用于增强内容提取结果的功能,如文档中的布局元素、条形码和数字。
分析器 用于处理和提取文件中内容和结构化字段的组件。 内容理解针对常见场景提供了一些分析器模板。
分析器结果 分析器在处理输入数据后生成的输出。 这一部分通常包括以 Markdown 格式提取的内容、提取的字段和特定于模态的可选详细信息。
分析器模板 分析器的预定义配置和字段架构。 使用此功能,可以对模板进行修改,而不是从头开始,从而大大简化了分析器的创建过程。 此功能仅在 Azure AI Foundry 门户中可用,而不能通过 REST API/SDK 使用。
类别 分类器中的非重复类,用于根据共享特征或特征对类似的输入文件进行分组。
置信度分数 所提取数据准确无误的确定性级别。
字段架构 要从输入中提取的字段的正式说明。 它为每个字段指定名称、说明、值类型、生成方法等。
Fields 从内容派生的结构化键值对列表,由字段架构定义。 详细了解支持的字段值类型。
File 任何类型的数据,包括文本、文档、图像、视频和音频。
文件类型 文件的 MIME 类型,例如 text/plain、application/pdf、image/jpeg、audio/wav 和 video/mp4。 通用类别(如文档)是指服务支持的所有相应 MIME 类型。
生成方法 确定指定字段的提取值的过程。 内容理解支持以下功能:
• 提取:直接从输入内容中提取值,例如收据的日期或发票的项目详细信息。
• 分类:将内容归类到预定义的类别中,例如通话中的情绪或图表类型。
• 生成:根据输入数据生成值,例如对音频对话进行总结或基于视频生成场景描述。
接地源 内容中生成数值的特定区域。 它具有不同的表示形式,具体取决于文件类型:
• 图像 - 图像中的多边形,通常是轴对齐矩形(边界框)。
• PDF/TIFF - 特定页面上的多边形,通常是四边形。
• 音频 - 开始和结束时间范围。
• 视频 - 每帧都有可选多边形(通常是边界框)的开始和结束时间范围。
人员目录 用于存储人脸数据的结构化方式,用于识别任务。 可以将单个人脸添加到目录,然后搜索视觉上相似的人脸。 还可以创建个人档案,将人脸与之关联,并将新人脸图像与已知个人匹配。 此设置支持跨图像和视频的灵活人脸匹配和标识识别。
处理位置 一个 API 请求参数,用于定义 Azure AI 服务在其中分析数据的地理区域。 可以从三个选项中进行选择: geographydataZoneglobal 控制处理的位置。 此设置有助于满足数据驻留要求,并根据需求优化性能或可伸缩性。
跨度 一个引用,用于指示以 Markdown 格式提取的内容中字段、单词等元素的位置。 字符偏移量和长度共同用于表示范围。 不同的编程语言使用的字符编码各不相同,这可能会影响 Unicode 文本中偏移量和长度值的准确性。 为了避免混淆,仅在请求中显式指定所需的编码时返回范围。 如果某些元素在 Markdown(例如页面)中不是连续的,则可以映射到多个范围。