为数据科学教程准备系统

在开始数据科学端到端教程系列之前,请了解先决条件、如何将笔记本(.ipynb)添加到工作区,以及如何将 Lakehouse 附加到这些笔记本。

先决条件

创建笔记本

Get Started 端到端系列中的每个教程都可用作 GitHub 中的 Jupyter 笔记本文件。 其他许多教程也可用作数据科学工作负载中的示例。 使用以下方法之一访问教程:

  • 创建新笔记本,然后复制并粘贴本教程中的代码。

  • 将笔记本(.ipynb)从 GitHub 上传到工作区:

    1. 下载笔记本。 请确保使用 GitHub 中的“Raw”文件链接下载文件。

    2. 在 Fabric Web 应用中,转到工作区。

    3. 在工作区命令栏中,选择“ 上传”,然后选择下载的笔记本(.ipynb)文件。

    4. 上传完成后,可在工作区中使用笔记本。

    5. 如果上传的笔记本包含输出,请选择 “编辑 ”菜单,然后选择“ 清除所有输出”。

      屏幕截图显示用于清除所有输出的编辑菜单选项。

    小窍门

    在工作区中看不到上传笔记本(.ipynb)的选项?

    1. 使用 “创建新笔记本”,然后复制并粘贴本教程中的代码。
    2. 或者,在数据科学工作负载中使用 “打开示例笔记本 ”选项(如果可用)。
    3. 如果组织启用了 Git 集成,则还可以从连接的存储库中引入笔记本。
  • 在数据科学工作负载中打开示例笔记本(可用时):

    1. 在左窗格中,选择 工作负载

    2. 选择 数据科学

    3. 在“浏览示例”卡片中,选择“选择”。

    4. 选择相应的示例:

      • 默认情况下,如果示例是针对 Python 教程,请从 端到端工作流(Python) 选项卡开始。
      • 如果示例对应的是 R 教程,则从“端到端工作流(R)”选项卡中进行选择。
      • 如果示例对应的是快速教程,则从“快速教程”选项卡中进行选择。

将湖屋附加到笔记本

为了演示 Fabric Lakehouse 的功能,许多教程都需要将默认的 Lakehouse 附加到笔记本中。 以下步骤显示如何将湖屋添加到已启用 Fabric 的工作区中的笔记本中。

注意

在执行每个笔记本之前,需要在该笔记本上执行这些步骤。

  1. 在工作区中打开笔记本。

  2. 在左窗格中选择“添加湖屋”。

    将湖屋附加到笔记本的过程步骤图。

  3. 创建新的湖屋或使用现有的湖屋。

    1. 若要创建新的湖屋,请选择“新建”。 为湖屋命名并选择 创建
    2. 若要使用现有的湖仓,请选择 现有的湖仓 打开 数据枢纽 对话框。 选择要使用的湖屋,然后选择“添加”。
  4. 添加湖屋后,它将显示在湖屋窗格中,你可以查看存储在 Lakehouse 中的表和文件。

下一步

第 1 部分:使用 Apache Spark 将数据引入 Fabric Lakehouse