了解从图像提取数据

3 分钟

AI 提供支持的信息提取取代了手动检查每个内容以获取见解的需求。计算机视觉可以从图像中提取见解，以描述他们描述的人、地点、事物和字词。

计算机视觉是由经过训练以基于大量现有图像识别特征的机器学习模型实现的。机器学习模型通过将图像转换为数字信息来处理图像。在核心上，视觉模型对数值信息执行计算，从而预测图像中的内容。

显示信封上手写地址的屏幕截图。地址被数字化，显示在图像旁边，以示范 OCR 的例子。

光学字符识别（OCR） 可帮助计算机识别图像中的元素包含文本。 OCR 是处理图像中的文本的基础，并使用经过训练的机器学习模型将各个形状识别为字母、数字、标点符号或其他文本元素。实现这种功能的早期工作大部分是由邮政服务完成，用于支持基于邮政编码的邮件自动分类。从那时起，阅读文本的最先进技术取得了突破性的进展，我们有模型能够检测图像中的打印或手写文本，并且可以逐行逐字进行数字化。

注释

与视觉相关的机器学习概念在计算机视觉概念简介中进行了深入介绍。

接下来，让我们看看如何使用基于 OCR 的技术从表单中提取数据。

反馈

此页面是否有帮助？