了解多模式数据提取
AI 支持的信息提取技术可以组合在一起,对内容多种形式(从文档到视频和音频)执行数据提取。 使用多模式数据提取可以帮助进行数字资产管理、工作流自动化、生成进一步见解等。
提取技术的业务流程可以包括视觉和文档智能,其他包括:
- 自然语言处理 可用于使用书面或口语查找关键短语、实体、情绪等。
注释
与 NLP 关联的机器学习概念在 自然语言处理概念简介中进行了深入介绍。
- 语音识别可提取口语并将其转换为可处理的数据(通常通过将其转录为文本来实现)。 口语可以是音频文件中的录音,也可以是麦克风传出的实时音频。
注释
Azure 上的语音入门介绍了语音识别。
- 生成式AI 可以通过允许用户识别和定义自己的字段及字段说明,从而增强数据提取过程。 处理非结构化内容时,它特别有用。 一个示例是用户添加的“summary”字段。 必须基于内容中的数据生成与字段关联的 值 。
注释
在 Azure 上生成 AI 的简介中深入介绍了生成 AI 概念。
用于多模态信息提取的内容处理管道可以包括这些提取技术的层级。 管道输出的一个示例是结构化见解和其他生成的内容。
