连接 Azure Data Lake Storage Gen2 进行数据流存储

可以将数据流配置为将其数据存储在组织的 Azure Data Lake Storage Gen2 帐户中。 本文介绍执行此作所需的一般步骤,并在此过程中提供指导和最佳做法。

重要

具有分析表功能的数据流利用 Azure Synapse Link for Dataverse 服务,该服务可提供不同级别的合规性、隐私、安全性和数据位置承诺。 有关 Azure Synapse Link for Dataverse 的详细信息,请转到 什么是 Azure Synapse Link for Dataverse?

配置数据流以在 Data Lake 中存储其定义和数据文件有一些优点,例如:

  • Azure Data Lake Storage Gen2 为数据提供极其可缩放的存储设施。
  • IT 部门的开发人员可以利用数据流数据和定义文件来利用 Azure 数据和人工智能 (AI) 服务,如 Azure 数据服务的 GitHub 示例所示。
  • 它使组织中的开发人员能够使用数据流和 Azure 的开发人员资源将数据流数据集成到内部应用程序和业务线解决方案中。

要求

若要将 Azure Data Lake Storage Gen2 用于数据流,需要满足以下条件:

  • Power Apps 环境。 任何 Power Apps 计划都允许使用 Azure Data Lake Storage Gen2 作为目标创建数据流。 需要在环境中作为创建者获得授权。
  • 一份 Azure 订阅。 需要使用 Azure 订阅才能使用 Azure Data Lake Storage Gen2。
  • 一个资源组。 使用已有的资源组,或创建新资源组。
  • 一个 Azure 存储帐户。 存储帐户必须启用 Data Lake Storage Gen2 功能。

小窍门

如果没有 Azure 订阅,请在开始之前 创建一个免费试用帐户

请为 Power Platform 数据流准备您的 Azure Data Lake Storage Gen2

在使用 Azure Data Lake Storage Gen2 帐户配置环境之前,必须创建和配置存储帐户。 下面是 Power Platform 数据流的要求:

  1. 必须在与 Power Apps 租户相同的Microsoft Entra ID 租户中创建存储帐户。
  2. 建议在计划在其中使用的 Power Apps 环境所在的同一区域中创建存储帐户。 若要确定 Power Apps 环境的位置,请联系环境管理员。
  3. 存储帐户必须启用分层名称空间功能。
  4. 必须在存储帐户上被授予“所有者”角色。

以下部分将讲解配置 Azure Data Lake Storage Gen2 帐户的必要步骤。

创建存储帐户

请按照 创建 Azure Data Lake Storage Gen2 存储帐户中的步骤进行操作。

  1. 请确保选择与环境相同的区域,并将存储设置为 StorageV2(常规用途 v2)。
  2. 请确保启用分层命名空间功能。
  3. 建议将复制设置设置为读取访问异地冗余存储(RA-GRS)。

将 Azure Data Lake Storage Gen2 连接到 Power Apps

在 Azure 门户中设置 Azure Data Lake Storage Gen2 帐户后,即可将其连接到特定的数据流或 Power Apps 环境。 将数据湖连接到环境后,环境中的其他创建者和管理员也可以创建数据流,将其数据存储在组织的数据湖中。

若要将 Azure Data Lake Storage Gen2 帐户与数据流连接,请执行以下步骤:

  1. 登录到 Power Apps,并验证你所在的环境。 环境切换器位于标头的右侧。

  2. 在左侧导航窗格中,选择 “数据”旁边的向下箭头。

    Power Apps Maker 门户“数据”选项卡。

  3. 在显示的列表中,选择 “数据流 ”,然后在命令栏上选择“ 新建数据流”。

    创建新的数据流。

  4. 选择所需的分析表。 这些表指示要在组织的 Azure Data Lake Store Gen2 帐户中存储的数据。

    选择分析表。

选择要用于数据流存储的存储帐户

如果存储帐户尚未与环境关联,则会显示 “链接到 Data Lake ”对话框。 需要您登录并找到在前几个步骤中创建的数据湖。 在此示例中,没有数据湖与环境关联,因此会提示您添加一个数据湖。

  1. 选择存储帐户。

    此时会显示 “选择存储帐户” 屏幕。

    选择存储帐户。

  2. 选择存储帐户的 订阅 ID

  3. 选择在其中创建存储帐户的 资源组名称

  4. 输入 存储帐户名称

  5. 选择“保存”

这些步骤成功完成后,Azure Data Lake Storage Gen2 帐户将连接到 Power Platform 数据流,你可以继续创建数据流。

注意事项和限制

使用数据流存储时,请注意一些注意事项和限制:

  • 默认环境中不支持链接用于数据流存储的 Azure Data Lake Store Gen2 帐户。
  • 为数据流配置数据流存储位置后,无法更改该位置。
  • 链接存储帐户后,不支持更改环境的名称,并且链接到该存储帐户的数据流将失败。 更改环境名称后,将重新启用这些数据流。
  • 默认情况下,环境的任何成员都可以使用 Power Platform 数据流连接器访问数据流数据。 但是,只有数据流的所有者才能直接在 Azure Data Lake Storage Gen2 中访问其文件。 若要授权更多人直接访问数据湖中的数据流数据,必须授权他们访问数据湖中的数据流 CDM 文件夹或数据湖本身。
  • 删除数据流后,也会删除该湖中的 CDM 文件夹
  • 不支持尝试在两种不同存储类型的工作区之间(自带存储帐户(BYOSA)和内部)连接两个数据流表。

重要

不应更改由组织湖中的数据流创建的文件,也不应将文件添加到数据流的 CDM 文件夹。 更改文件可能会损坏数据流或更改其行为,并且不受支持。 Power Platform 数据流仅授予对它在湖中创建的文件的读取访问权限。 如果将其他人或服务授权给 Power Platform 数据流使用的文件系统,则仅授予他们对该文件系统中的文件或文件夹的读取访问权限。

隐私声明

通过在组织中启用通过 Azure Synapse Link for Dataverse 服务创建带有分析表的数据流,Azure Data Lake 存储帐户的详细信息(例如存储帐户的名称)将会被发送并存储到 Azure Synapse Link for Dataverse 服务中。由于该服务目前位于 PowerApps 符合性边界之外,所采用的隐私和安全措施可能会与 PowerApps 中通常实施的不同或较少。 请注意,可以随时删除 Data Lake 关联以停止使用此功能,Azure Data Lake 存储帐户详细信息将从 Azure Synapse Link for Dataverse 服务中删除。 本文提供了有关 Azure Synapse Link for Dataverse 的详细信息

常见问题

如果我以前在组织的 Azure Data Lake Storage Gen2 中创建过数据流,并且想要更改其存储位置,该怎么办?

创建数据流后,无法更改数据流的存储位置。

何时可以更改环境的数据流存储位置?

目前不支持更改环境的数据流存储位置。

后续步骤

本文提供了有关如何连接用于数据流存储的 Azure Data Lake Storage Gen2 帐户的指导。

有关数据流、Common Data Model 和 Azure Data Lake Storage Gen2 的详细信息,请转到以下文章:

有关 Azure 存储的详细信息,请转到以下文章:

有关 Common Data Model 的详细信息,请转到以下文章:

可以在 Power Apps 社区中提问。