你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

透明度说明：Azure AI 搜索

2025-06-25

重要

仅为方便起见，提供非英语翻译。请参阅 EN-US 版本以获取最终版本的此文档。

什么是透明度说明？

AI 系统不仅包括技术，还包括使用它的人员、受其影响的人员以及部署它的环境。创建适合其预期用途的系统需要了解技术的工作原理、其功能和限制，以及如何实现最佳性能。 Microsoft 的透明度说明旨在帮助你了解 AI 技术的工作原理、系统所有者可通过哪些选择来影响系统性能和行为，以及保持系统全局观（包括技术、人员和环境）的重要性。开发或部署自己的系统时，可以使用透明度说明，或者与将使用或受系统影响的人员共享它们。

Microsoft 的透明度说明是 Microsoft 将其 AI 原则付诸实践的广泛努力的一部分。若要了解详细信息，请参阅 Microsoft AI 原则。

Azure AI 搜索的基础知识

介绍

Azure AI 搜索为开发人员提供了工具、API 和 SDK，用于通过 Web、移动和企业应用程序中的专用异类内容构建丰富的搜索体验。搜索是向用户显示数据的任何应用程序的基础。常见方案包括目录或文档搜索、在线零售商店或对专有内容的数据浏览。

可搜索数据可以采用文本或矢量的形式，并从数据源引入 as-is，或者通过使用 AI 来扩充，以提高整体搜索体验。开发人员可以通过选择调用外部机器学习模型（称为嵌入模型）将数据转换为数字表示形式（称为矢量）。索引器可以选择包括技能集，这些技能集通过多个 Azure AI 语言功能（例如命名实体识别（NER）和个人身份信息（PII）检测）以及 Azure AI 视觉功能（包括光学字符识别（OCR）和图像分析），来支持强大的数据扩充套件。

有关 Azure AI 搜索如何使用 Azure AI 服务或其他 AI 系统改进搜索体验的详细信息，以更好地了解客户的内容的意向、语义和隐含结构，请参阅以下选项卡。

AI 增强是将 Azure AI 服务中的机器学习模型应用于难以直接搜索的原始内容上。通过扩充，可以使用分析和推理来创建以前不存在的可搜索内容和结构。

AI 扩充是 Azure AI 搜索索引器管道的可选扩展，它连接到客户的搜索服务所在的同一区域中的 Azure AI 服务。扩充管道的核心组件与典型的索引器（索引器、数据源、索引）以及指定原子扩充步骤的技能集相同。可以使用基于 Azure AI 服务 API 的内置技能（例如 Azure AI 视觉和 Azure AI 语言）或运行提供的外部代码的自定义技能来组合技能集。

矢量搜索是一种信息检索方法，其中文档和查询在索引中表示为向量而不是纯文本。在矢量搜索中，从 Azure AI 搜索外部托管的机器学习模型生成源输入的矢量表示形式，可以是文本、图像、音频或视频内容。这种内容（称为矢量嵌入）的数学和规范化表示形式为搜索方案提供了一个常见基础。

当所有内容都是向量时，即使关联的原始内容是不同的媒体类型（如图像与文本）或与查询不同的语言，查询也可以在向量空间中找到匹配项。搜索引擎会扫描索引，查找最相似的矢量内容，即最接近查询中的向量。例如，在数学向量表示形式上匹配（而不是关键字）可以更可能查找共享语义含义但文本上不同的匹配项，例如“car”和“auto”。这更详细地介绍了矢量嵌入以及相似性算法的工作原理。

关键术语

条款	定义
矢量嵌入	一种高度优化的方法来表示反映机器学习模型从图像、音频、视频或文本中提取的含义和理解的数据。内容在索引编制和查询时都转换为矢量嵌入。矢量搜索相当于获取查询中提供的嵌入内容，并在索引中查找最相似的嵌入内容。然后，结果通常按相似度进行排序。
嵌入空间	单个字段语料库中的所有向量都占据相同的嵌入空间，其中相似项彼此靠近，不同的项相距较远。嵌入空间的维度越高，可以在单个向量中包含更多信息，并大大提升用户的搜索体验，但会导致索引存储大小增加和查询延迟加大。

语义排名器使用查询的上下文或语义含义来计算新的相关性分数，以便优先排列那些在语义上最接近原始查询意图的结果。初始结果集可能来自具有 BM25 排名、矢量搜索或包含两者的混合搜索的关键字搜索。它还通过提取结果中找到的逐字内容和“突出显示”来创建并返回“标题”，以引起人们对结果中重要内容的注意。如果查询具有问题（“什么是水冰点”）的特征，并且结果包含具有答案特征的文本（“水冻结在 0°C 或 32°F”）时，也可以返回“答案”。

关键术语

条款	定义
语义排序器	使用查询的上下文和语义含义，通过使用语言理解来重新排名搜索结果来提高搜索相关性。
语义标题和重点	从最能汇总内容的文档中提取句子和短语，其中突出显示了关键段落，便于扫描。当单个内容字段对于结果页过于密集时，汇总结果的标题非常有用。突出显示的文本会提升最相关的术语和短语，这样用户就能够快速确定匹配被视为相关的原因。
语义答案	提供从语义查询返回的可选附加子结构。它为看起来像问题的查询提供了直接的答案。它要求文档包含带有答案特征的文本。

GenAI 提示技能是 Azure AI 搜索技能目录的一部分，使客户能够基于其数据使用 AI 生成的内容增强其搜索索引。通过使用客户的组织自己的数据和首选项，此技能有助于生成符合特定需求的定制摘要、答案或见解。

这意味着当最终用户通过 AI 搜索搜索客户的内容时，AI 生成的内容可以提供更丰富的上下文感知结果，从而使用户更容易找到他们查找的信息。

关键术语

条款	定义
技能	Azure AI 搜索技能是 Azure AI 搜索扩充管道中的模块化处理组件。这些技能在编制索引期间将 AI 驱动的转换应用于原始内容（如文本、图像或文档），从而从非结构化数据中提取结构化的可搜索信息。
提示	在 API 调用中发送到服务的文本。然后，此文本将输入到模型中。例如，可能会输入以下提示：将问题转换为命令：问：问康斯坦斯是否需要一些面包 A： send-msg `find constance` 是否需要一些面包？问：向格雷格发送一条消息，以确定周三情况是否准备就绪。答：周三的发送消息 `find greg` 都准备好了吗？
搜索索引	在 Azure AI 搜索中，索引是保存可搜索内容、定义存储方式的数据结构，并控制服务在运行查询时如何解释它。

代理检索是一种并行查询处理体系结构，它使用对话式大型语言模型（LLM）作为“查询规划器”。LLM 根据需要将用户的聊天历史记录转换为一个或多个重点子查询。这些子查询在 Azure AI 搜索索引上同时运行，服务合并顶部结果，返回：

包含最相关的段落（基于数据）的单个内容字符串。
公开完整源文档或区块的引用数组（可选）。
一个活动数组，列出每个操作、令牌计数和延迟，以协助成本跟踪和调试。

关键术语

条款	定义

代理检索	这指的是 AI 代理规划和执行一系列步骤，以从地面源检索信息。这包括查询和优化搜索等活动，以获取查询最相关的信息。
基础设置数据	代理检索返回的文档/信息集。作为外部 LLM 可以引用或转换为自然语言答案的事实依据，确保可追溯性和降低幻觉风险。
查询规划器	将对话历史记录分解为子查询，以查找与基础搜索查询最相关的背景数据。
子查询	LLM 生成的单个查询。子查询基于请求中的用户问题、聊天历史记录和参数。子查询以 Azure AI 搜索中的索引文档（纯文本和矢量）为目标。

能力

系统行为

Azure AI 搜索中用于 AI 扩充的多个内置技能利用 Azure AI 服务。有关选择使用技能时的注意事项，请参阅下面链接的每个内置技能的透明度说明：

关键短语提取技能： Azure AI 语言 - 关键短语提取
语言检测技能： Azure AI 语言 - 语言检测
实体链接技能： Azure AI 语言 - 实体链接
实体识别技能： Azure AI 语言 - 命名实体识别（NER）
PII 检测技能：Azure AI 语言 - PII 检测
情绪技能： Azure AI 语言 - 情绪分析
图像分析技能： Azure AI 视觉 - 图像分析
OCR 技能：Azure AI 视觉 - OCR
文档布局技能：文档智能

请参阅每个技能的文档，详细了解其各自的功能、限制、性能、评估和集成和负责任的使用方法。请注意，结合使用这些技能可能会导致叠加效应（例如，使用 OCR 时引入的错误会在关键短语提取时累积出现）。

用例

示例用例：

由于 Azure AI 搜索是全文搜索解决方案，因此 AI 扩充的目的是改进非结构化内容的搜索实用工具。下面是内置技能支持的内容扩充方案的一些示例：

翻译和 语言检测 支持多语言搜索。
实体识别从大量文本中提取人员、地点和其他实体。
关键短语提取 标识并输出重要术语。
OCR 识别二进制文件中的打印文本和手写文本。
图像分析 描述图像内容，并将说明输出为可搜索文本字段。
集成向量化 是一项预览功能，它调用 Azure OpenAI 嵌入模型来向量化数据并将嵌入内容存储在 Azure AI 搜索中，以便进行相似性搜索。

局限性

Azure AI 搜索中的 AI 扩充使用服务的索引器和数据源功能来调用 Azure AI 服务来执行内容扩充。此过程中使用的索引器和数据源的限制将适用。有关这些相关限制的详细信息，请查看索引器和数据源文档。 Azure AI 搜索中 AI 扩充管道使用的每个 Azure AI 服务的限制也将适用。有关这些限制的详细信息，请参阅每个服务的透明度说明。

详细了解负责任 AI

详细了解 Azure AI 搜索

反馈

此页面是否有帮助？

通过

透明度说明：Azure AI 搜索

什么是透明度说明？

Azure AI 搜索的基础知识

介绍

能力

系统行为

用例

示例用例：

局限性

详细了解负责任 AI

详细了解 Azure AI 搜索

反馈

其他资源