教程:从 Snowflake 配置 Microsoft Fabric 镜像数据库

在本教程中,你将从 Snowflake 配置 Fabric 镜像数据库。

在此示例中,你将了解如何配置与 Snowflake 数据源(s)的安全连接以及其他有用的信息,以便熟悉并熟悉 Microsoft Fabric 中的镜像概念。

注释

虽然此示例特定于 Snowflake,但可以找到为其他数据源(如 Azure SQL 数据库或 Azure Cosmos DB)配置镜像的详细步骤。 有关详细信息,请参阅什么是 Fabric 中的镜像?

先决条件

  • 创建或使用现有的 Snowflake 仓库。 可以在任何云中连接到任何版本的 Snowflake 实例,包括Microsoft Azure。
  • 需要现有的 Fabric 容量。 如果没有, 请启动 Fabric 试用版
  • 你需要对 Snowflake 数据库拥有用户权限,该数据库包含以下权限。 有关详细信息,请参阅 Snowflake 文档,了解 流式处理表的访问控制权限流所需的权限
    • CREATE STREAM
    • SELECT table
    • SHOW tables
    • DESCRIBE tables
  • 用户需要至少分配一个角色,该角色允许访问 Snowflake 实例。
  • 检查网络要求以访问 Snowflake 数据源。 如果 Snowflake 数据源不可公开访问且位于专用网络中, 请创建虚拟网络数据网关安装本地数据网关 以镜像数据。 Azure 虚拟网络或网关计算机的网络必须通过专用终结点连接到 Snowflake 实例,或者防火墙规则允许。

创建镜像数据库

在本部分中,我们将简要概述如何创建新的镜像数据库以用于镜像 Snowflake 数据源。

可以使用现有工作区(而不是“我的工作区”)或创建新的工作区。

  1. 在工作区中,导航到 “创建 ”中心。
  2. 选择要使用的工作区后,选择“ 创建”。
  3. 向下滚动并选择 镜像雪花 卡。
  4. 输入新数据库的名称。
  5. 选择 创建

在任何云中连接到 Snowflake 实例

注释

可能需要更改防火墙云,以允许镜像连接到 Snowflake 实例。

  1. 在“新建连接”下选择 Snowflake,或选择现有连接。

  2. 如果选择“新建连接”,请输入 Snowflake 数据库的连接详细信息。

    连接设置 Description
    服务器 可以通过导航到 Snowflake 资源菜单上的帐户来查找服务器名称。 将鼠标悬停在帐户名称上,可以将服务器名称复制到剪贴板。 https://从服务器名称中删除该名称。
    Warehouse 从 Snowflake 的资源菜单中的 “仓库 ”部分,选择“ 仓库”。 仓库是 Snowflake 仓库(计算),而不是数据库。
    连接 创建新连接。
    连接名称 应自动填写。将其更改为要使用的名称。
    数据网关 根据方案,选择默认(无)或虚拟网络数据网关或本地数据网关的名称。
    身份验证类型 Snowflake
    用户名 要登录到 Snowflake.com 而创建的 Snowflake 用户名。
    密码 创建登录信息时创建的 Snowflake 密码 Snowflake.com。
  3. 从下拉列表中选择数据库。

启动镜像过程

  1. “配置镜像”屏幕允许你镜像数据库中的所有数据,这是默认选项。

    • 镜像所有数据意味着,镜像启动后创建的任何新表都会被镜像。
    • 也可选择只镜像某些对象。 禁用“镜像所有数据”选项,然后从数据库中选择单独的表。

    在本教程中,我们将选择“镜像所有数据”选项。

  2. 选择“镜像数据库”。 镜像开始。

    Fabric 门户中的屏幕截图,其中显示了镜像的雪花正在运行。“监视镜像”按钮可见。

  3. 等待 2-5 分钟。 然后,选择“监视复制”以查看状态。

  4. 几分钟后,状态应变为“正在运行”,这表明正在同步表。

    如果未看到表和相应的复制状态,请等待几秒钟,然后刷新面板。

  5. 完成表的初始复制后,“上次刷新”列中会显示一个日期。

  6. 现在,你的数据已启动并运行,整个 Fabric 中具有各种可用的分析场景。

重要

在源数据库中建立的任何粒度的安全性,都必须在 Microsoft Fabric 中的镜像数据库中重新配置。

监视结构镜像

配置镜像后,将定向到“镜像状态”页。 可以在此处监视复制的当前状态。

有关复制状态的详细信息和细节,请参阅监视 Fabric 镜像数据库复制

重要

如果源表中没有更新,复制器引擎将开始恢复,持续时间呈指数级增加,最长为一小时。 复制器引擎将在检测到更新的数据后自动恢复常规轮询。