教程:将数据引入仓库

适用于:✅Microsoft Fabric 中的仓库

本教程介绍如何将数据从 Microsoft Azure 存储引入仓库以创建表。

注意

本教程构成了 端到端方案的一部分。 若要完成本教程,必须先完成以下教程:

  1. 创建工作区
  2. 创建仓库

引入数据

在此任务中,了解如何将数据引入仓库以创建表。

  1. 请确保在 第一个教程中创建的工作区 处于打开状态。

  2. 在工作区登陆窗格中,选择“+ 新建项” 以显示可用项类型的完整列表。

  3. 从列表中,在 “获取数据 ”部分中,选择 “管道 ”项类型。

  4. 在“新建管道”窗口中的“名称”框中,输入 Load Customer Data

    “新建管道”对话框的屏幕截图,其中突出显示了输入的名称。

  5. 要配置管道,请选择“创建”。 当“创建管道”登陆页面出现时,预配已完成。

  6. 在管道登陆页上,选择 管道活动

    “构建管道的登陆页”屏幕截图,突出显示了“管道活动”选项。

  7. 在该菜单中,进入“移动和转换”部分,选择“复制数据”。

    “移动和转换”部分的屏幕截图,其中显示了选择“复制数据”的位置。

  8. 在管道设计画布上,选择“复制数据”任务。

    位于设计画布上的复制数据的屏幕截图。

  9. 若要设置活动,请在 常规 页上的 名称 框中,将默认文本替换为 CD Load dimension_customer

    “常规”选项卡的屏幕截图,其中显示了输入复制活动名称的位置。

  10. “源 ”页上的“ 连接 ”下拉列表中,选择 “更多 ”以显示可从中选择的所有数据源,包括 OneLake 目录中的数据源。

  11. 选择“+ 新建 以创建新数据源。

  12. 搜索并选择“Azure Blob”

  13. 在“连接数据源”页上的“账户名或 URL”框中输入 https://fabrictutorialdata.blob.core.windows.net/sampledata/

  14. “连接名称”下拉列表会自动填充,身份验证类型设置为“匿名”。

    “连接到数据源”窗口的屏幕截图,其中显示了完成的所有设置。

  15. 选择“连接” 。

  16. 在“源”页上,若要访问数据源中的 Parquet 文件,请进行以下设置:

    1. 在“文件路径”框中,输入:

      1. 文件路径 - 容器:sampledata

      2. 文件路径 - 目录:WideWorldImportersDW/tables

      3. 文件路径 - 文件名:dimension_customer.parquet

    2. “文件格式 ”下拉列表中,选择 Parquet

  17. 若要预览数据并测试没有错误,请选择 预览数据

    “源”页的屏幕截图,其中突出显示了前面步骤所做的更改和预览数据函数。

  18. “目标 ”页上的 “连接 ”下拉列表中 Wide World Importers ,选择仓库。

  19. 为“表选项”选择“自动创建表”选项。

  20. 在第一个 框中,输入 dbo

  21. 在第二个框中,输入 dimension_customer

    “目标”页的屏幕截图,其中突出显示了前面步骤中所做的更改的位置。

  22. 在“主页”功能区上,选择“运行”。

  23. “保存并运行?” 对话框中,选择 “保存并运行”,以便让管道加载 dimension_customer 表。

    “保存并运行”对话框的屏幕截图,其中突出显示了“保存和运行”按钮。

  24. 若要监视复制活动的进度,可查看“输出”页中的管道运行活动(等待其完成并显示为“成功”状态)。

    “输出”页的屏幕截图,其中突出显示了“成功”状态。

下一步