Fabric 中的镜像 提供了一种简单的体验,以避免复杂的 ETL(提取转换加载),并将现有的 Azure SQL 数据库资产与 Microsoft Fabric 中的其余数据集成。 可以直接将现有的 Azure SQL 数据库复制到 Fabric 的 OneLake 中。 在 Fabric 中,可以解锁强大的商业智能、人工智能、数据工程、数据科学和数据共享方案。
有关在 Fabric 中配置用于镜像的 Azure SQL 数据库的教程,请参阅 教程:从 Azure SQL 数据库配置 Microsoft Fabric 镜像数据库。
若要详细了解和观看 Fabric 中的镜像 Azure SQL 数据库的演示,请观看以下 “数据公开”情节。
为什么在 Fabric 中使用镜像?
在 Fabric 中使用镜像时,无需将来自多个供应商的不同服务拼凑在一起。 相反,你可以享受高度集成的端到端和易于使用的产品,旨在简化分析需求,并为Microsoft、Azure SQL 数据库和 1000 年代可读取开源 Delta Lake 表格式的技术解决方案的开放和协作而构建。
内置了哪些分析体验?
镜像数据库是 结构数据仓库 中的项,不同于 仓库 和 SQL 分析终结点。
创建镜像数据库会在 Fabric 工作区中创建以下项:
每个镜像的 Azure SQL 数据库都有自动生成的 SQL 分析终结点 ,在镜像过程创建的增量表的基础上提供丰富的分析体验。 用户可以访问熟悉的 T-SQL 命令,这些命令可以定义和查询数据对象,但不能作 SQL 分析终结点中的数据,因为它是只读副本。 可以在 SQL 分析终结点中执行以下作:
- 浏览从 Azure SQL 数据库引用 Delta Lake 表中的数据的表。
- 在不编写代码行的情况下,不直观地创建代码查询和视图并浏览数据。
- 开发 SQL 视图、内联 TVF(表值函数)和存储过程,以在 T-SQL 中封装语义和业务逻辑。
- 管理对象的权限。
- 在同一工作区中查询其他仓库和 Lakehouses 中的数据。
除了 SQL 查询编辑器,还有一个广泛的工具生态系统,可以查询 SQL 分析终结点,包括 SQL Server Management Studio (SSMS),使用 Visual Studio Code 的 mssql 扩展,甚至 GitHubCopilot。
镜像防火墙后面的 Azure SQL 数据库
如果 Azure SQL 数据库不可公开访问,并且不允许 Azure 服务 连接到它,则可以设置 虚拟网络数据网关 或 本地数据网关 来镜像数据。 数据网关通过专用终结点或受信任的专用网络促进与源数据库的安全连接。 有关详细信息,请参阅 教程:从 Azure SQL 数据库配置 Microsoft Fabric 镜像数据库。
活动事务、工作负载和复制程序引擎行为
- 活动事务继续保留事务日志截断,直到事务提交和镜像的 Azure SQL 数据库赶上,或事务中止。 长时间运行的事务可能会导致事务日志填满比平常多。 应监视源数据库事务日志,以便事务日志无法填充。 有关详细信息,请参阅 事务日志由于长时间运行的事务和 CDC 而增长。
- 每个用户工作负荷各不相同。 在初始快照期间,对于 CPU 和 IOPS(每秒输入/输出作,读取页面),源数据库可能有更多的资源使用率。 表更新/删除作可能会导致日志生成增加。 详细了解如何 监视 Azure SQL 数据库的资源。
层和购买模型支持
源 Azure SQL 数据库可以是单一数据库,也可以是弹性池中的数据库。
- vCore 购买模型中的所有服务层级均受支持。
- 对于 DTU(数据库事务单位)购买模型,不支持在免费、基本或标准服务层级中创建的数据库,且 100 个 DTU 不到 100 个 DTU。
Pricing
用于将数据复制到 Fabric OneLake 的构造计算是免费的。 OneLake 中的存储是免费的,具体取决于容量大小。 有关详细信息,请参阅 镜像成本和OneLake 镜像定价。 通过 SQL、Power BI 或 Spark 查询数据的计算使用情况仍基于构造容量收费。