你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文介绍如何使用 Azure Synapse Analytics 在 Azure Data Lake Gen 2(Azure Data Lake Gen 2)存储帐户中将数据从一个位置引入到另一个位置。
先决条件
- Azure 订阅:如果没有 Azure 订阅,请在开始之前创建 一个免费的 Azure 帐户 。
- Azure 存储帐户:使用 Azure Data Lake Gen 2 作为 源 数据存储。 如果没有存储帐户,请参阅 “创建 Azure 存储帐户 ”,了解创建存储帐户的步骤。
创建链接服务
在 Azure Synapse Analytics 中,链接服务用于定义与其他服务的连接信息。 在本部分中,你将添加 Azure Synapse Analytics 和 Azure Data Lake Gen 2 作为链接服务。
- 打开 Azure Synapse Analytics UX,然后转到“ 管理 ”选项卡。
- 在 “外部连接”下,选择 “链接服务”。
- 若要添加链接服务,请选择“ 新建”。
- 从列表中选择 Azure Data Lake Storage Gen2 磁贴,然后选择“ 继续”。
- 输入身份验证凭据。 帐户密钥、服务主体和托管标识目前支持身份验证类型。 选择测试连接以验证凭据是否正确。
- 完成后,选择“ 创建 ”。
创建管道
管道包含用于执行一组活动的逻辑流。 在本部分中,你将创建一个管道,其中包含一个复制活动,用于将数据从 Azure Data Lake Gen 2 引入专用 SQL 池。
- 转到 “业务流程协调 ”选项卡。在管道标头旁边的加号图标上选择,然后选择 “管道”。
- 在“活动”窗格中的 “移动和转换 ”下,将 “复制数据” 拖到管道画布上。
- 选择复制活动,然后转到“ 源 ”选项卡。选择“ 新建 ”以创建新的源数据集。
- 选择 Azure Data Lake Storage Gen2 作为数据存储,然后选择“继续”。
- 选择 DelimitedText 作为格式,然后选择“继续”。
- 在“设置属性”窗格中,选择创建的 ADLS 链接服务。 指定源数据的文件路径,并指定第一行是否具有标头。 可以从文件存储区或示例文件导入架构。 完成后选择“确定”。
- 转到“ 接收器 ”选项卡。选择“ 新建 ”以创建新的接收器数据集。
- 选择 Azure Data Lake Storage gen2 作为数据存储,然后选择“继续”。
- 选择 DelimitedText 作为格式,然后选择“继续”。
- 在“设置属性”窗格中,选择创建的 ADLS 链接服务。 指定要在其中写入数据的文件夹的路径。 完成后选择“确定”。
调试和发布管道
完成管道配置后,可以在发布项目之前执行调试运行,以验证一切是否正确。
- 若要调试管道,请在工具栏上选择“调试”。 可以在窗口底部的“输出”选项卡中看到管道运行的状态。
- 在管道可以成功运行后,在顶部工具栏中选择“全部发布”。 此操作会将您创建的实体(数据集和管道)发布到 Synapse Analytics 服务。
- 等待直到您看到“已成功发布”消息。 若要查看通知消息,请选择右上角的钟按钮。
触发和监视管道
在此步骤中,你将手动触发在上一步骤中发布的管道。
- 选择工具栏中的“添加触发器”,然后选择“立即触发”。 在 “管道运行 ”页上,选择“ 完成”。
- 转到左侧边栏中的“ 监视 ”选项卡。 此时会看到由手动触发器触发的管道运行。 可以使用 操作 列中的链接来查看活动详情并重新运行管道。
- 若要查看与管道运行关联的活动运行,请选择“操作”列中的“查看活动运行”链接。 此示例中只有一个活动,因此列表中只看到一个条目。 有关复制操作的详细信息,请在操作列中选择“详细信息”链接(眼镜图标)。 选择顶部的 “管道运行 ”,返回到“管道运行”视图。 若要刷新视图,请选择“刷新”。
- 验证数据是否已正确写入专用 SQL 池。
后续步骤
有关 Azure Synapse Analytics 的数据集成的详细信息,请参阅将数据 引入专用 SQL 池 文章。