创建数据流

数据流是在 Power BI 服务中的工作区中创建和管理的表的集合。 是一组列,用于存储数据,这与数据库中的表非常类似。 可以直接从在其中创建数据流的工作区添加和编辑数据流中的表并管理数据刷新计划。 要创建数据流,请通过浏览器启动 Power BI 服务,然后从导航窗格中选择一个工作区(在 Power BI 服务中的 我的工作区 中不可用)。 也可以新建一个工作区,用于创建新的工作流。

可以通过多种方式创建或在新的数据流基础上构建:

以下各节详细探讨了每种数据流创建方式。

注意

高级工作区中的用户、具有 Pro 许可证的用户和具有 Premium Per User (PPU) 许可证的用户可以创建数据流。

使用新源创建数据流

使用 “新建源 ”选项时,可以定义新表并连接到新的数据源。

  1. 选择屏幕上的 “获取数据...” 链接,或使用功能区中的 “新建源 ”选择源。

    显示数据源选项的屏幕截图。

  2. 选择数据源时,系统会提示提供连接设置,如下图所示。

    选择 Azure SQL 作为连接器后显示的窗体的屏幕截图。

  3. 连接后,可以选择要用于表的数据。 当你选择数据和源时,Power BI 会重新连接到数据源。 重新连接按照在后面的设置过程中选择的频率持续刷新数据流中的数据。

    在“选择数据”屏幕上选择表的屏幕截图。

  4. 选择要在表中使用的数据后,可以使用数据流编辑器来调整或将这些数据转换为数据流中使用的格式。

使用链接表创建数据流

使用链接表创建数据流时,可以引用以只读方式在另一个数据流中定义的现有表。 以下列表描述了可能选择此方法的一些原因:

  • 若要在多个数据流(如日期表或静态查找表)中重复使用表,请创建一次该表,然后在其他数据流中引用该表。

  • 为了避免对数据源创建多次刷新,请使用链接表来存储数据并充当缓存。 每个后续使用者都使用该表,从而减少对基础数据源的负载。

  • 在两个表之间执行合并。

注意

链接表仅在 Power BI Premium 中可用。

使用计算表创建数据流

使用计算表创建数据流时,可以引用链接表,然后以写入方式对其进行操作。 结果是数据流的一部分的新表。 可以通过两种方式将链接表转换为计算表。 可以通过合并操作创建新查询,或者如果要编辑或转换表,则可以创建表的引用或者复制表。

如何创建计算表

创建包含表列表的数据流后,可以对这些表执行计算。 在 Power BI 服务的数据流创作工具中,选择 “编辑表”,然后右键单击要用作计算表的基础的表以及要对其执行计算的表。 在上下文菜单中,选择“引用”

若要使表符合计算表的条件,必须选择“ 启用加载 ”,如下图所示。 右键单击该表以显示此上下文菜单。

所选表上的上下文菜单的屏幕截图,其中突出显示了“启用加载”。

选择“ 启用加载”时,将创建一个新表,其源是引用的表。 图标更改为显示 计算结果 的图标,如下图所示。

突出显示了表的已更改图标的屏幕截图。

在此新创建的表上执行的任何转换在已驻留在 Power BI 数据流存储中的数据上运行。 这意味着查询不会针对从中导入数据的外部数据源运行,例如从 Azure SQL 数据库拉取的数据。 而是对驻留在数据流存储中的数据执行查询。

示例用例

可以使用计算表执行哪种类型的转换? 可以使用 Power BI 或 M 编辑器中的转换用户界面执行通常指定的任何转换。 执行存储中计算时,支持所有这些转换。

请考虑以下示例:你有一个 帐户 表,其中包含 Dynamics 365 订阅中所有客户的原始数据。 你还具有来自服务中心的 ServiceCalls 原始数据,其中包含每年每天从不同的帐户执行的支持调用的数据。

假设你想要使用 ServiceCalls 表中的数据来扩充 Account 表。 首先,需要聚合 ServiceCalls 表中的数据,以计算去年针对每个帐户执行的支持调用数。

“按帐户 ID 分组”屏幕的屏幕截图。

接下来,需要将 Account 表与 ServiceCallsAggregated 表合并,以计算扩充的 帐户 表。

“合并”屏幕的屏幕截图

然后,可以看到结果,如下图所示的 EnrichedAccount

合并结果的屏幕截图

完成了。 转换是在您的 Power BI Premium 订阅中的数据流内的数据上执行的,而不是在源数据上执行的。

注意

计算表是 Premium 专用功能

使用 CDM 文件夹创建数据流

从 CDM 文件夹创建数据流时,可以引用另一个应用程序以 Common Data Model (CDM) 格式写入的表。 需要提供 ADLS Gen 2 中存储的 CDM 格式化文件的完整路径。

“将新 CDM 文件夹附加到新数据流”屏幕的屏幕截图。

以下列表描述了从 CDM 文件夹创建数据流的要求:

  • ADLS Gen 2 帐户必须具有为 Power BI 设置的相应权限才能访问该文件。

  • 尝试创建数据流的用户必须有权访问 ADLS Gen 2 帐户。

  • URL 必须是 JSON 文件的直接文件路径,并使用 ADLS Gen 2 终结点;不支持 blob.core。

使用导入/导出创建数据流

使用导入/导出创建数据流时,可以从文件导入数据流。 如果要脱机保存数据流副本或将数据流从一个工作区移到另一个工作区,则此工具非常有用。

若要导出数据流,请选择创建的数据流,然后选择 “更多 ”菜单项(省略号)以展开选项,然后选择“ 导出 .json。 系统会提示下载 CDM 格式表示的数据流。

所选数据流的屏幕截图,其中打开了“更多”下拉菜单。

若要导入数据流,请选择 “导入 ”框并上传文件。 Power BI 会为你创建数据流,并允许按原样保存数据流或执行其他转换。

通过将数据放入数据流中,可以使用 Power BI Desktop 和 Power BI 服务来创建语义模型、报表、仪表板和应用。 这些新资源可让你深入了解业务活动。 以下文章详细介绍了数据流的常见使用方案: