你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure AI 内容理解是一项高级生成式 AI 服务,旨在从多模式内容(如文档、图像、视频和音频)中派生结构化见解。 随着版本引入 2025-05-01-preview ,该服务现在提供两种不同的模式: standard 和 pro。
标准:此模式用作处理各种内容类型的默认解决方案。 它经过优化,可提供针对所有数据格式的特定任务定制的高效架构提取。 此模式强调成本效益和降低延迟,确保结构化见解可供常规处理需求访问。
Pro:此模式专为高级用例设计,尤其是需要多步骤推理和复杂决策(例如,识别不一致、绘制推理和做出复杂决策)的用户。 Pro 模式允许来自多个内容文件的输入,并包括用于在分析器创建时提供引用数据的选项。 目前,专业模式仅针对基于文档的数据提供。
标准模式概述
内容理解标准模式跨各种数据类型提供结构化见解,包括文档、视频、图像、音频和文本。 虽然它不支持数据推理,但它可最大程度地降低成本和延迟,使其非常适合以数据为中心的广泛方案。 此模式使您能够创建或自定义架构,以根据您的需求提取精确的见解。 此外,它还包含文档数据的数据标签,允许人工输入提高输出的质量。
标准模式:用例
“Standard” 是一个理想的服务,能够帮您从任何类型的数据中提取所需的精准见解。 如果只想解锁数据的内容,则方案可能不需要复杂的推理或决策。 标准模式适用于的方案包括:
- 构建数据,为 RAG 搜索工作流提供支持,并与 AI 搜索集成。
- 提取数据以与 Microsoft Fabric 集成。
- 分析广告视频以筛查其是否符合内容指南。
- 分段视频片段以创建章节并识别理想的广告中断。
- 从运动会中提取关键数据点并提供赛后回顾。
Pro 模式概述
内容理解专业模式专为具有复杂用例、提供多步骤推理功能和多输入文档支持的客户定制。 它支持对输入内容和引用数据进行推理,因此非常适合需要复杂分析的方案。 通过合并引用数据,pro 模式将上下文添加到每个请求,从而帮助验证和扩充等任务。 目前,Pro 模式仅可用于文档数据。
专业模式参考数据
在创建分析器时,可以提供一些文档,以便在推理过程中为引用服务提供上下文。 例如,如果要分析发票以确保它们与合同协议一致,则可以提供发票和其他相关文档(例如采购订单)作为输入,并提供合同文件作为参考数据。 该服务根据您的模式应用推理来校验输入文档,以便识别并标记差异,供进一步审查。 如果文档处于专业模式的输入文档服务限制内,如果遇到任何质量问题,我们还建议尝试将所有文档作为输入文档提供。
多步骤推理
多步骤推理提供将复杂问题分解为简单任务的功能。 多步骤推理比提取和聚合结构化数据更进一步地进行数据分析,并允许你得出有关该数据的结论,最大程度地减少人工评审的需求。 专业模式可通过多步骤推理来解答的问题类型示例包括:
- x 是否匹配 y?
- x 是否通过概述的条件?
- x 文档是否遵循所需的准则?
- 总计是否等于项的总和?
- 查找发票与合同之间的所有不一致。
标准和专业模式功能
不确定哪种模式适合你的方案? 以下图表比较了标准和专业模式功能。
| 功能 / 特点 | 标准模式 | Pro 模式 |
|---|---|---|
| 大型文档 | ✓ | ✓ |
| 现场模式 | ✓ | ✓ |
| 提取、分类和生成字段 | ✓ | ✓ |
| 基础设置和置信度分数 | ✓ | ✗ |
| 输入文档类型 | 文档、图像、视频、音频 | 文档 |
| 最大字段 | 100 | 100 |
| 多个输入文档处理 | ✗ | ✓ |
| 引用数据集集成 | ✗ | ✓ |
| 多步骤推理 | ✗ | ✓ |
将标准模式或专业模式应用于你的场景
可以将内容理解标准和专业模式应用到几乎所有方案,但构建解决方案的方式取决于要回答的问题。 以下方案演示了如何将标准和专业模式应用于数据的示例。
| 情景 | 标准模式 | Pro 模式 |
|---|---|---|
| 发票分析 | 大规模从发票数据中提取见解,并实现 RAG 搜索以及进行进一步的数据分析和可视化。 回答以下问题: • 提取供数据库录入使用的采购订单编号、总计、截止日期和订单项目。 |
分析与客户签订的发票和合同协议,并应用多步骤推理来得出有关该数据的结论。 回答以下问题: • 此发票是否满足我们与此客户签订的合同协议? • 此发票是否需要进一步审查? |
| 呼叫中心脚本分析 | 提取大量呼叫中心数据的见解,以获取有关情绪的宝贵见解,了解客户问题,并创建有针对性的培训来解决主要难题。 回答以下问题: • 客户呼吁的主要问题是什么? • 关于 x 问题的调用的平均长度是多少? |
分析呼叫中心脚本数据并应用多步骤推理,以了解呼叫中心员工如何满足客户需求,以及他们是否遵循准则。 回答以下问题: • 呼叫中心员工是否介绍自己? • 此答案是否 通过了 某些标准? |
| 抵押贷款申请处理 | 从抵押贷款应用程序数据中提取关键值,使其可搜索且更易于访问。 回答以下问题: • 提交抵押贷款申请的年份是什么? • 应用程序上的名称是什么? |
分析补充支持文件和抵押贷款申请,以确定潜在购房者是否提供所有必要的文档来保护抵押贷款。 回答以下问题: • 抵押贷款申请上的姓名和社会保障号码是否与支持文档匹配? |
试用 Pro 模式
可以使用 Azure AI Foundry 试用内容理解标准和专业模式的功能。 借助该服务,可以在轻型无代码方法中引入自己的数据并试验这两种模式的所有功能,以帮助你找到最适合独特方案的功能。
Pro 模式已知限制和最佳做法
内容理解专业模式当前不提供置信度分数或基础设置。 它当前支持字段的生成和分类,但不支持仅提取。
内容理解专业模式目前仅适用于文档。
引用文档时,系统在 查找模式下 运行。 因此,不应期望全面的信息检索。 如果需要详尽恢复数据,建议将文档合并到输入集中。
架构的设计应尽可能具有最高级别的特定性。 例如,建议为每种不一致类型创建不同的字段,而不是呈现不一致性的通用列表,并附带详细说明。 此外,在可行的情况下,应包括对应审查的相关文档的特定部分的引用。
参考文档应简洁且专注。 确定基本文档的优先级,并确保它们尽可能简短,以增强保留和召回率。
后续步骤
有关文档处理的详细信息,请参阅 文档处理概述。