模块 1:使用数据工厂创建管道

此模块需要大约 10 分钟才能完成。 你将使用管道中的复制活动,将源存储中的原始数据引入 Data Lakehouse 中的 bronze 数据层的表。

模块 1 中的高级步骤包括:

  1. 创建管道。
  2. 在管道中创建复制活动以将示例数据加载到 Data Lakehouse 中。
  3. 运行并查看复制活动的结果

先决条件

创建管道

  1. 登录到 Power BI。

  2. 选择屏幕左下角的默认 Power BI 图标,然后选择 Fabric

  3. “工作区 ”选项卡中选择工作区,然后选择“ + 新建项”,然后搜索并选择 “管道”。

    数据工厂起始页的屏幕截图,其中显示了用于创建新管道的按钮。

  4. 提供管道名称。 然后选择“创建”

在管道中创建复制活动以将示例数据加载到 Data Lakehouse

  1. 选择“复制数据助手”打开复制助手工具

    显示从新管道起始页选择“复制数据”活动的屏幕截图。

  2. 在“ 选择数据源 ”页上,从对话框顶部的选项中选择 “示例数据 ”,然后选择 “NYC 出租车 - 绿色”。

    显示选择“选择数据源”选项卡上复制助手中的 NYC 出租车 - 绿色数据的屏幕截图。

  3. 数据源预览接下来显示在 “连接到数据源” 页面上。 查看,然后选择“下一步”

    显示 NYC 出租车 - 绿色示例数据集的预览数据的屏幕截图。

  4. 对于复制助手的 “选择数据目标 ”步骤,请选择 Lakehouse

  5. 输入 Lakehouse 名称,然后选择创建并连接

  6. 选择 连接

  7. 为“根文件夹”选择“表”,为“加载设置”选择“加载到新表”。 提供一个名称(在本示例中,我们将其命名为Bronze),然后选择下一步

    此屏幕截图显示了复制数据助手中“连接到数据目标”选项卡,在“选择并映射到文件夹路径或表”步骤。

  8. 最后,在复制数据助手的“查看 + 保存”页上,查看配置。 在本教程中,请取消选中 “立即开始数据传输” 复选框,因为我们会在下一步骤中手动运行该活动。 然后选择“确定”

    显示“审阅 + 保存”页上的“复制数据助手”的屏幕截图。

运行并查看复制活动的结果

  1. 在管道编辑器中选择“运行”选项卡。 然后选择“ 运行 ”按钮,然后选择 “保存并运行”以运行复制活动。

    显示管道运行选项卡的屏幕截图,其中突出显示了“运行”按钮。

  2. 可以监视该运行,并在管道画布下方的“输出”选项卡上检查结果。 选择管道的名称以查看运行详细信息。

    显示管道“输出”选项卡中的“运行详细信息”按钮的屏幕截图。

  3. 展开“持续时间明细”部分,查看复制活动的每个阶段的持续时间。 查看复制的详细信息后,选择“关闭”

后续步骤

继续下一部分以创建数据流。