你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
| 术语 | 说明 |
|---|---|
| 加载项 | 添加了一些可用于增强内容提取结果的功能,如文档中的布局元素、条形码和数字。 |
| 分析器 | 用于处理和提取文件中内容和结构化字段的组件。 内容理解针对常见场景提供了一些分析器模板。 |
| 分析器结果 | 分析器在处理输入数据后生成的输出。 这一部分通常包括以 Markdown 格式提取的内容、提取的字段和特定于模态的可选详细信息。 |
| 分析器模板 | 分析器的预定义配置和字段架构。 使用此功能,可以对模板进行修改,而不是从头开始,从而大大简化了分析器的创建过程。 此功能仅在 Azure AI Foundry 门户中可用,而不能通过 REST API/SDK 使用。 |
| 类别 | 分类器中的非重复类,用于根据共享特征或特征对类似的输入文件进行分组。 |
| 置信度分数 | 所提取数据准确无误的确定性级别。 |
| 字段架构 | 要从输入中提取的字段的正式说明。 它为每个字段指定名称、说明、值类型、生成方法等。 |
| Fields | 从内容派生的结构化键值对列表,由字段架构定义。 详细了解支持的字段值类型。 |
| File | 任何类型的数据,包括文本、文档、图像、视频和音频。 |
| 文件类型 | 文件的 MIME 类型,例如 text/plain、application/pdf、image/jpeg、audio/wav 和 video/mp4。 通用类别(如文档)是指服务支持的所有相应 MIME 类型。 |
| 生成方法 | 确定指定字段的提取值的过程。 内容理解支持以下功能: • 提取:直接从输入内容中提取值,例如收据的日期或发票的项目详细信息。 • 分类:将内容归类到预定义的类别中,例如通话中的情绪或图表类型。 • 生成:根据输入数据生成值,例如对音频对话进行总结或基于视频生成场景描述。 |
| 接地源 | 内容中生成数值的特定区域。 它具有不同的表示形式,具体取决于文件类型: • 图像 - 图像中的多边形,通常是轴对齐矩形(边界框)。 • PDF/TIFF - 特定页面上的多边形,通常是四边形。 • 音频 - 开始和结束时间范围。 • 视频 - 每帧都有可选多边形(通常是边界框)的开始和结束时间范围。 |
| 人员目录 | 用于存储人脸数据的结构化方式,用于识别任务。 可以将单个人脸添加到目录,然后搜索视觉上相似的人脸。 还可以创建个人档案,将人脸与之关联,并将新人脸图像与已知个人匹配。 此设置支持跨图像和视频的灵活人脸匹配和标识识别。 |
| 处理位置 | 一个 API 请求参数,用于定义 Azure AI 服务在其中分析数据的地理区域。 可以从三个选项中进行选择: geography, dataZone并 global 控制处理的位置。 此设置有助于满足数据驻留要求,并根据需求优化性能或可伸缩性。 |
| 跨度 | 一个引用,用于指示以 Markdown 格式提取的内容中字段、单词等元素的位置。 字符偏移量和长度共同用于表示范围。 不同的编程语言使用的字符编码各不相同,这可能会影响 Unicode 文本中偏移量和长度值的准确性。 为了避免混淆,仅在请求中显式指定所需的编码时返回范围。 如果某些元素在 Markdown(例如页面)中不是连续的,则可以映射到多个范围。 |