非结构化数据作为知识源

Copilot Studio 允许你使用通过 Power Platform 连接器构建的同样受信任且熟悉的数据源,增强具备特定领域知识的代理。

通过从您的设备、OneDrive 或 SharePoint 上传外部内容,您可以利用根据您的业务量身定制的上下文知识来丰富您的代理。 这些文件安全地存储在 Microsoft Dataverse 中,并自动处理到语义索引和矢量嵌入中。 此配置使代理能够基于你提供的信息生成更准确的基于地面响应。

在 Copilot Studio 中上传的文件使用 Microsoft Dataverse 引入原始文件来创建索引和矢量嵌入,这有助于为代理提供质量响应。 可以从计算机上传这些文件,也可以通过连接到 OneDrive 或 SharePoint 来上传这些文件。

将文件作为知识源上传可帮助制造商使用额外数据丰富其代理、增强语言模型的知识,以及使代理以制造商提供的特定信息为基础。 制作者可以上载各种文件,作为矢量嵌入以语义方式为文件编制索引,然后将其用作智能体的知识。 然后,可以将代理中使用的此知识与经过身份验证和未经身份验证的代理用户共享。

图中描述了代理制造商与代理用户之间的交互,以及知识源如何检索要提供给用户的信息。

为了改进代理的响应,上传的文件被分块成块,以便更快地处理和矢量索引,以提供与用户的查询的语义匹配。 这些文件安全地存储在 Dataverse 中。 当用户通过代理查询时,Copilot Studio 会找到与用户查询意向匹配的最相关的区块,并将结果返回给用户。 

同样,Dataverse 引入 OneDrive 文件、SharePoint 文件(使用文件上传下的选项)以及来自 Salesforce、ServiceNow、Confluence 和 ZenDesk 等其他企业系统中的知识库文章等非结构化内容,为代理提供更好的语义结果。

Power Platform 用于非结构化数据的连接器

以下 Power Platform 连接器 配置为使用非结构化数据源:

OneDrive

One Drive 允许创建者使用文件选择器界面来选择要包含的文件和文件夹。 选择后,项目会被检索至 Dataverse 并进行索引,以供使用。 添加的文件夹包括该文件夹中所有受支持的文件和子文件夹,并且不超过总文件限制

SharePoint

SharePoint 文档允许创建者使用文件选择器界面来选择要包含的文件和文件夹。 选择后,项目会被检索至 Dataverse 并进行索引,以供使用。 添加的文件夹包括该文件夹中所有受支持的文件和子文件夹,并且不超过总文件限制。 目前不支持 Pages。

Salesforce

非结构化数据的 Salesforce 连接器支持检索包含知识文章的知识库。 创建者选择一个知识库,该知识库中的所有文章都编制索引以供使用。 无法选择单个文章或主题。 查询数据时,无法指定特定项目或知识库。 知识列表会显示您在创建源时选定的所有知识对象的单一对象。

ServiceNow

ServiceNow 的非结构化数据连接器支持检索包含知识文章的知识库。 知识库包含文章。 创建者选择一个知识库,该知识库中的所有文章都编制索引以供使用。 无法选择单个文章。 查询数据时,无法指定知识库、文件夹或单个项目。 知识列表会显示您在创建源时选定的所有知识对象的单一对象。

合流

非结构化数据的 Confluence 连接器支持检索包含页的空格的功能,也支持子文件夹。 无法选择单个页面。 查询数据时,无法指定页面。 知识列表显示空间中所有页面的单个对象。

Zendesk

Zendesk 的非结构化数据连接器支持检索含有知识文章的知识库。 无法选择单个文章、类别或分区。 查询数据时,无法指定项目、类别或节。 知识列表显示知识库中所有文章的单个对象。

安全性

当用户查询使用 Power Platform Connector 源的代理时,会进行一些授权检查。

连接器访问

当创建者首次使用基于连接器的源时,系统会要求他们选择现有的 Power Platform 连接器或添加一个连接器。 此过程可确保仅与具有适当权限的制造商共享数据,并提供对数据源本身的访问权限。

内容访问

进行查询时,用户的连接信息用于检查数据源,以确保他们有权查看内容。 尽管区块和索引存储在 Dataverse 本地,但对查询执行实时检查,以确保当前用户在提供摘要或响应之前有权访问数据。

注释

  • 如果用户对一组特定文件或知识库文章没有权限,则不会返回结果,并且他们收到“找不到结果”的标准消息。如果用户认为该源应该有结果,他们需要与管理员合作,以确保他们有权访问他们尝试访问的数据。
  • 内容权限信息不会存储在本地。 所有权限检查都与源一起实时完成,以确保是最新的。

同步和文件刷新频率

OneDrive 和 SharePoint 中的已连接文件以及非结构化的知识文章均通过定期计划的同步任务来保持最新。 此作业在后台自动运行,刷新文件的内容,并重新编制更改索引,以便为查询提供准确的结果。 刷新不仅管理对内容的更改,而且还确保从源中删除的任何内容不再显示为任何查询响应的一部分。 目前,无法手动触发刷新。

有关刷新频率计时的详细信息,请转到 Copilot Studio 非结构化数据知识源限制

许可

涉及知识的所有请求都按 Microsoft Copilot 生成式应答消息速率收费。 有关详细信息,请转到 计费费率和管理

如果知识源需要引入数据,则数据的存储以及检索该数据的相应索引将受到客户拥有的存储权利的约束。 有关 Dataverse 自然语言搜索的详细信息,请转到 使用 Dataverse 搜索增强 AI 支持的体验

限制和局限性

首次启用非结构化数据支持时,在处理添加的文件之前,Dataverse 配置和索引可能会延迟 5 到 30 分钟。 时间长度取决于当前 Dataverse 环境的大小。

每个代理最多可以有 500 个知识对象。 这些对象可以是文件、文件夹、知识文章、网站或其他源。

目前,智能体中一次只能使用五个不同的源。 例如,SharePoint、Dataverse、OneDrive 或其他源。

有关受支持的非结构化数据源的具体上限和限制的详细信息,请转到 Copilot Studio 非结构化数据源知识源限制

注释

Copilot Studio 代理需要通过 Dataverse 搜索来使用此知识源。 如果无法将启用了 Dataverse 的文件添加到代理,请让管理员在环境中启用 Dataverse 搜索。 有关 Dataverse 搜索以及如何管理它的详细信息,请参阅 什么是 Dataverse 搜索配置环境的 Dataverse 搜索

FAQ

“添加知识”对话框的“上传文件”部分中未显示 SharePoint 图标?

安装解决方案到解决方案显示在所有现有组织中,之间存在轻微延迟。 若要启动手动更新,请执行以下步骤:

  1. 使用管理员凭据登录到 Power Platform 管理中心
  2. 在侧导航上,选择“ 管理”。
  3. 从产品列表中选择 Dynamics 365 Apps。 此时会打开一个窗格。
  4. 搜索“PowerAIExtensions”。
  5. 选择 Microsoft Dynamics 365 - PowerAIExtensions 的 (...) 图标,然后选择“安装”。
  6. 从下拉菜单中选择环境,然后选择“ 安装”。
  7. 安装完成后,在新窗口中打开 Power Apps
  8. 在侧导航上,选择“ 解决方案”。
  9. 选择“ 查看历史记录”。
  10. 搜索“PowerAIExtensions_Anchor”,并确保它设置为 1.01.688 或更高版本。

在“添加知识”对话框中,两个 SharePoint 选项之间的区别是什么?

“添加知识 ”对话框中,有两个 SharePoint 选项。 文件上传部分中的 SharePoint 选项(1)用于上传单个 SharePoint 文件或文件夹,并启用文件同步功能。 另一个 SharePoint 选项 (2) 在 Copilot Studio 中提供 SharePoint 的完全支持。

“添加知识”对话框的屏幕截图,其中突出显示了两个 SharePoint 选项。

向代理添加 500 多个知识对象时会发生什么情况?

除非首先删除以前的对象,否则无法添加任何进一步的对象。

每个代理是否都有自己的知识源索引?

知识源存储在 Dataverse 中,以便在其创建的环境中使用。 如果在多个代理中使用同一个 SharePoint 文件夹,则文件夹的单个实例用于所有代理。

如果在添加 SharePoint 或 OneDrive 源时选择的文件、文件夹和子文件夹数超过最大数目的文件夹,会发生什么情况?

Copilot Studio 将检索并索引最多达到最大数量的文件、文件夹和子文件夹,并对其进行索引。 其余未处理。 目前,没有任何消息指示已处理或未处理的内容。

我添加的文件之一(或是我添加的文件夹的一部分)显示为知识源的一部分,但我无法从中获取答案。 为什么?

此问题可能与以下原因之一相关:

  • 文件或文件夹在知识页面上设置为“就绪”。
  • 确保文件名不包含不受支持的字符(特别是 SharePoint 文件)。
  • 确保文件没有 机密高度机密的敏感度设置,或具有密码保护。
  • 确保它是受支持的文件类型。
  • 如果文件或文件夹来自其他用户的 OneDrive 或 SharePoint 网站,请验证它是否与创建者共享。
  • 如果该文件是知识库文件,请确保帐户有权查看源系统中的内容。