Azure Data Lake Storage Gen2

概要

条目 DESCRIPTION
发布状态 一般可用性
产品 Power BI (语义模型)
Power BI (数据流)
Fabric(Dataflow Gen2)
Power Apps(数据流)
Dynamics 365 Customer Insights
Analysis Services
支持的身份验证类型 组织帐户
帐户密钥
共享访问签名 (SAS) 密钥
服务主体
功能参考文档 AzureStorage.DataLake
AzureStorage.DataLakeContents

注释

由于部署计划和主机特定的功能,某些功能可能存在于一个产品中,但不是其他功能。

先决条件

  • 一份 Azure 订阅。 转到获取 Azure 免费试用版

  • 具有分层命名空间的存储帐户。 按照 “创建存储帐户” 中的说明创建一个。 本文假设您已经创建了一个名为myadlsg2的存储帐户。

  • 确保为存储帐户授予以下角色之一: Blob 数据读取者Blob 数据参与者Blob 数据所有者

  • 存储帐户中一个名为 Drivers.txt 的示例数据文件。 可以从 Azure Data Lake Git 存储库下载此示例,然后将该文件上传到存储帐户。

支持的功能

  • 进口
  • 文件系统视图
  • CDM 文件夹视图

从 Power Query Desktop 连接到 Azure Data Lake Storage Gen2

  1. 在获取数据体验中选择 Azure Data Lake Storage Gen2 。 Power Query Desktop 中的“获取数据”体验因应用而异。 有关 Power Query Desktop 从应用中获取数据体验的详细信息,请转到在何处获取数据

  2. Azure Data Lake Storage Gen2 对话框中,使用容器终结点格式提供 Azure Data Lake Storage Gen2 帐户、容器或子文件夹的 URL。 Data Lake Storage Gen2 的 URL 具有以下模式:

    < https:// accountname.dfs.core.windows.net/><container>/<subfolder>

    还可以选择是要使用文件系统视图还是通用数据模型文件夹视图。

    选择“确定”以继续。

    Azure Data Lake Storage Gen2 对话框的屏幕截图,其中输入了 URL。

  3. 如果这是你第一次使用此 URL 地址,系统会要求你选择身份验证方法。

    如果选择组织帐户方法,请选择 “登录 ”以登录到存储帐户。 随即将重定向到组织的登录页面。 按照提示登录到帐户。 成功登录后,选择连接

    如果选择帐户密钥方法,请输入帐户密钥,然后选择 “连接”。

    Azure Data Lake Storage Gen2 的登录对话框的屏幕截图,其中已选择组织帐户,并已准备好登录。

  4. 导航器 ”对话框显示你提供的 URL 下的所有文件。 验证信息,然后选择 转换数据 以转换 Power Query 或 加载 中的数据以加载数据。

    导航器打开并包含 Drivers.text 文件中数据的屏幕截图。

使用 Power Query Online 连接到 Azure Data Lake Storage Gen2

  1. 在获取数据体验中选择 Azure Data Lake Storage Gen2 选项。 不同的应用可以通过不同的方式访问 Power Query Online 来获取数据体验。 有关如何从应用获取 Power Query Online 的“获取数据”体验的详细信息,请转到从何处获取数据的位置

    “获取数据”窗口的屏幕截图,其中强调了 Azure Data Lake Storage Gen2。

  2. 连接到数据源中,输入 Azure Data Lake Storage Gen2 帐户的 URL。 请参阅限制以确定要使用的 URL。

    Azure Data Lake Storage Gen2 的“连接到数据源”页的屏幕截图,其中输入了 URL。

  3. 选择是要使用文件系统视图还是 Common Data Model 文件夹视图。

  4. 如果需要,请在 数据网关中选择本地数据网关。

  5. 选择登录以登录到 Azure Data Lake Storage Gen2 帐户。 随即将重定向到组织的登录页面。 按照提示登录到该帐户。

  6. 成功登录后,选择下一步

  7. 选择数据 ”页显示你提供的 URL 下的所有文件。 验证信息,然后选择“ 转换数据 ”以在 Power Query 中转换数据。

    “选择数据”页的屏幕截图,其中包含 Drivers.text 文件中的数据。

局限性

Power Query Online 和 Power BI Desktop 不支持的子文件夹或文件

目前,在 Power Query Online 和 Power BI Desktop 中,Azure Data Lake Storage Gen2 连接器仅支持包含容器的路径,而不支持子文件夹或文件。 例如,https://<accountname>.dfs.core.windows.net/<container> 有效,而 https://<accountname>.dfs.core.windows.net/<container>/<filename> 或 https://<accountname>.dfs.core.windows.net/<container>/<subfolder> 可能会失败。

刷新身份验证

当 Azure Data Lake Storage Gen2(ADLS)帐户位于其他租户中时,Microsoft不支持使用 OAuth2 身份验证进行数据流或语义模型刷新。 此限制仅适用于身份验证方法为 OAuth2(即尝试使用 Microsoft Entra ID 帐户连接到跨租户 ADLS 时)的 ADLS。 在这种情况下,我们建议使用不同的身份验证方法,该方法不是 OAuth2/Microsoft Entra ID,例如密钥身份验证方法。

代理和防火墙要求

使用网关创建数据流时,可能需要更改某些代理设置或防火墙端口才能成功连接到 Azure Data Lake。 如果数据流在执行网关绑定刷新时出现故障,则可能是连接 Azure 存储服务端点时,网关上的防火墙或代理配置问题。

如果使用代理与您的数据网关搭配使用,则可能需要在本地数据网关中配置 Microsoft.Mashup.Container.NetFX45.exe.config 文件。 详细信息: 配置本地数据网关的代理设置

若要启用从网络到 Azure Data Lake 的连接,可能需要启用网关计算机上的特定 IP 地址。 例如,如果您的网络中有任何可能阻止这些尝试的防火墙规则,您需要解除对您 Azure 数据湖的出站网络连接的阻止。 若要启用列出所需的出站地址,请使用 AzureDataLake 服务标记。 详细信息: 虚拟网络服务标记

数据流还支持“自带”Data Lake 选项,这意味着创建自己的数据湖、管理权限,并显式将其连接到数据流。 在这种情况下,使用组织帐户连接到开发或生产环境时,必须为存储帐户启用以下角色之一:Blob 数据读取者、Blob 数据参与者或 Blob 数据所有者。

Power Query Online 和 Azure 存储位于同一区域

不支持直接访问启用了防火墙且与 Power Query Online 位于同一区域中的 Azure 存储帐户。 出现此限制的原因是,在部署在 Azure 存储帐户所在的同一区域中时,Power Query 服务使用专用 Azure IP 地址进行通信。 有关更多详细信息,请参阅 有关存储网络安全的 Azure 文档

若要解决此限制,并允许从同一区域中的 Power Query Online 访问 Azure 存储,请使用以下方法之一:

需要基于角色的访问控制(RBAC)

Power BI 需要基于角色的访问控制(RBAC)才能正常工作。 Power BI 访问不支持访问控制列表(ACL)。

另请参阅