你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
重要说明
Azure AI 内容理解是一种 Azure AI 服务 ,它使用生成 AI 将许多类型(文档、图像、视频和音频)的内容处理/引入到用户定义的输出格式。
内容理解提供了一个简化的过程来推理大量的非结构化数据,通过生成可集成到自动化和分析工作流的输出来加速价值实现时间。
为何使用内容理解?
简化和精简工作流。 Azure AI 内容理解将各种内容类型中的内容、结构和见解提取和分类标准化为统一过程。
简化字段提取。 通过内容理解的字段提取,可以更轻松地从非结构化内容生成结构化输出。 定义一个架构以提取、分类或生成字段值,无需复杂的提示工程
提高准确性。 内容理解使用多个 AI 模型同时分析和交叉验证信息,从而生成更准确、更可靠的结果。
置信度分数和基础设置。 内容理解可确保提取值的准确度,同时最大程度地降低人工审核成本。
内容理解用例
自动化。 内容理解通过将非结构化内容转换为结构化数据(可集成到各种工作流和应用程序中)来支持自动化方案。 置信度分数可最大程度地减少人工评审并降低成本。 例如,通过从发票中提取字段来自动执行采购和付款流程。
搜索与检索增强生成(RAG)。 内容理解允许将任何形式的内容引入到搜索索引中。 结构化输出表示形式改进了 RAG 方案的相关性。
分析和报告:内容理解提取的字段输出可增强分析和报告,使企业能够获取有价值的见解,进行更深入的分析,并根据准确的报告做出明智的决策。
通过分类优化工作流:内容理解的分类功能使你可以先对文档进行分类,然后再将其路由到关联的分析器进行提取。
应用程序
内容理解的常见应用包括:
| 应用程序 | 说明 |
|---|---|
| 通话后分析 | 企业和呼叫中心可以从通话记录中生成见解,以跟踪关键 KPI、改进产品体验、生成业务见解、创造差异化客户体验,并更快、更准确地应答查询。 |
| 媒体资产管理 | 软件和媒体供应商可以使用内容理解从视频中提取更丰富、针对性更强的信息,作为媒体资产管理解决方案。 |
| 税务自动化 | 税务准备公司可以使用内容理解从各种文档生成统一的信息视图,创建全面的纳税申报表。 |
| 图表理解 | 企业可以使用内容理解自动分析和解释各种类型的图表,从而增强图表理解。 |
| 抵押贷款申请处理 | 分析补充支持文档和抵押贷款申请,以确定潜在购房者是否提供了保护抵押贷款所需的所有文档。 |
| 发票合同验证 | 仔细查看与客户签订的发票和合同协议。 应用多步骤推理过程来分析数据。 确保验证发票与合同之间的一致性等结论准确彻底。 |
组件
| 组件 | 说明 |
|---|---|
| 分析器 | 分析器是内容理解的核心组件。 它允许客户配置内容提取设置和字段提取架构。 配置后,分析器会一致地应用这些设置来处理所有传入数据。 |
| 内容提取 | 使用内容提取,可以指定要标识和提取传入内容的信息类型。 可以将文本(如光学字符识别(OCR)结果、选择标记、条形码、公式和布局元素(如段落、节和表格)作为目标。 通过此方法,你可以专注于提取最相关的信息以满足你的需求。 |
| 字段提取 | 字段提取允许用户定义要从输入文件中提取的所需字段的结构和架构。 有关支持的字段类型的完整列表,请参阅服务限制。 字段可以通过以下方法之一生成: • 提取:直接提取值,按照它们显示在输入内容中的方式,例如收据中的日期或发票中的项目详细信息。 • 分类:对预定义类别集中的内容进行分类,例如通话情绪或图表类型。 • 生成:从输入数据自由地生成值,例如汇总音频对话或从视频创建场景描述。 |
| 接地源 | 内容理解可标识从中生成值的内容中的特定区域。 源基础设置使用户在自动化方案中能够快速验证字段值的正确性,从而提高提取的数据的置信度。 |
| 置信度分数 | 内容理解提供 0 到 1 的置信度分数,以估计结果的可靠性。 高分表示准确的数据提取,可在自动化工作流中实现直通式处理。 |
负责任 AI
Azure AI 内容理解旨在防范处理有害内容,如暴力描绘以及血腥、仇恨言论和欺凌、剥削、虐待等。 有关详细信息以及违禁内容的完整列表,请参阅我们的透明度说明和行为准则。
经过修改的内容筛选
内容理解支持为已批准的客户提供修改后的内容筛选。 内容筛选功能已针对获批客户修改的订阅 ID 会影响内容理解输出。 默认情况下,内容理解使用内容筛选系统,该系统在提交的提示和生成的输出中识别潜在有害内容的特定风险类别。 修改后的内容筛选允许系统批注而不是阻止潜在的有害输出,让你能够确定如何处理潜在的有害内容。 有关内容筛选器类型的详细信息,请参阅 内容筛选器类型。
重要说明
- 使用此表单申请修改的内容筛选器: Azure OpenAI 受限访问评审:修改的内容筛选器。
- 有关详细信息, 请参阅内容筛选。
人脸功能
内容理解中的人脸功能功能是有限的访问服务,需要注册才能访问。 内容理解中的人脸分组和识别功能根据资格和使用条件受到限制。 人脸服务仅适用于 Microsoft 托管客户和合作伙伴。 使用人脸识别引入表单来申请访问。 有关详细信息,请参阅 Microsoft的受限访问策略。
数据隐私和安全性
使用内容理解服务的开发人员应查看 Microsoft 有关客户数据的政策。 有关详细信息,请访问我们的数据、保护和隐私页面。
重要说明
如果使用 Microsoft 产品或服务处理生物特征数据,你需要负责以下事项:(i) 向数据主体提供通知,包括有关保留期和销毁的通知;(ii) 从数据主体处获得同意;(iii) 根据适用的数据保护要求删除生物特征数据。 “生物特征数据”将具有 GDPR 第 4 条中所述的含义,以及其他数据保护要求中的等效术语(如果适用)。 有关相关信息,请参阅 人脸的数据和隐私。
开始
我们的快速入门指南可帮助你快速开始使用内容理解服务: