你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

透明度说明:Azure AI 搜索

重要

仅为方便起见,提供非英语翻译。 请参阅 EN-US 版本以获取最终版本的此文档。

什么是透明度说明?

AI 系统不仅包括技术,还包括使用它的人员、受其影响的人员以及部署它的环境。 创建适合其预期用途的系统需要了解技术的工作原理、其功能和限制,以及如何实现最佳性能。 Microsoft 的透明度说明旨在帮助你了解 AI 技术的工作原理、系统所有者可通过哪些选择来影响系统性能和行为,以及保持系统全局观(包括技术、人员和环境)的重要性。 开发或部署自己的系统时,可以使用透明度说明,或者与将使用或受系统影响的人员共享它们。

Microsoft 的透明度说明是 Microsoft 将其 AI 原则付诸实践的广泛努力的一部分。 若要了解详细信息,请参阅 Microsoft AI 原则

介绍

Azure AI 搜索为开发人员提供了工具、API 和 SDK,用于通过 Web、移动和企业应用程序中的专用异类内容构建丰富的搜索体验。 搜索是向用户显示数据的任何应用程序的基础。 常见方案包括目录或文档搜索、在线零售商店或对专有内容的数据浏览。

可搜索数据可以采用文本或矢量的形式,并从数据源引入 as-is,或者通过使用 AI 来扩充,以提高整体搜索体验。 开发人员可以通过选择调用外部机器学习模型(称为嵌入模型)将数据转换为数字表示形式(称为矢量)。 索引器可以选择包括技能集,这些技能集通过多个 Azure AI 语言 功能(例如 命名实体识别(NER)个人身份信息(PII)检测)以及 Azure AI 视觉 功能(包括 光学字符识别(OCR)图像分析),来支持强大的数据扩充套件。

有关 Azure AI 搜索如何使用 Azure AI 服务或其他 AI 系统改进搜索体验的详细信息,以更好地了解客户的内容的意向、语义和隐含结构,请参阅以下选项卡。

AI 增强 是将 Azure AI 服务中的机器学习模型应用于难以直接搜索的原始内容上。 通过扩充,可以使用分析和推理来创建以前不存在的可搜索内容和结构。

AI 扩充是 Azure AI 搜索索引器管道的可选扩展,它连接到客户的搜索服务所在的同一区域中的 Azure AI 服务。 扩充管道的核心组件与典型的索引器(索引器、数据源、索引)以及指定原子扩充步骤的技能集相同。 可以使用基于 Azure AI 服务 API 的内置技能(例如 Azure AI 视觉Azure AI 语言)或运行提供的外部代码的 自定义技能 来组合技能集。

能力

系统行为

Azure AI 搜索中用于 AI 扩充的多个 内置技能 利用 Azure AI 服务。 有关选择使用技能时的注意事项,请参阅下面链接的每个内置技能的透明度说明:

请参阅每个技能的文档,详细了解其各自的功能、限制、性能、评估和集成和负责任的使用方法。 请注意,结合使用这些技能可能会导致叠加效应(例如,使用 OCR 时引入的错误会在关键短语提取时累积出现)。

用例

示例用例:

由于 Azure AI 搜索是全文搜索解决方案,因此 AI 扩充的目的是改进非结构化内容的搜索实用工具。 下面是内置技能支持的内容扩充方案的一些示例:

  • 翻译语言检测 支持多语言搜索。
  • 实体识别从大量文本中提取人员地点和其他实体
  • 关键短语提取 标识并输出重要术语。
  • OCR 识别二进制文件中的打印文本和手写文本。
  • 图像分析 描述图像内容,并将说明输出为可搜索文本字段。
  • 集成向量化 是一项预览功能,它调用 Azure OpenAI 嵌入模型来向量化数据并将嵌入内容存储在 Azure AI 搜索中,以便进行相似性搜索。

局限性

Azure AI 搜索中的 AI 扩充使用服务的索引器和数据源功能来调用 Azure AI 服务来执行内容扩充。 此过程中使用的索引器和数据源的限制将适用。 有关这些相关限制的详细信息,请查看 索引器和数据源文档 。 Azure AI 搜索中 AI 扩充管道使用的每个 Azure AI 服务的限制也将适用。 有关这些限制的详细信息,请参阅 每个服务的透明度说明

详细了解负责任 AI