教程:简介

适用于:✅SQL 分析终结点和 Microsoft Fabric 中的仓库

本教程是端到端数据仓库方案的分步演练,从数据收集到数据消耗。 完成本教程,以基本了解 Microsoft Fabric 用户体验、各种体验及其集成点,以及 Microsoft Fabric 专业和公民开发人员体验。

虽然数据和分析专业人员可能熟悉 Microsoft Fabric 中的许多概念,但在新环境中应用这些概念可能很困难。 本教程不是参考体系结构、特性和功能的详尽列表或具体最佳做法的建议。

数据仓库端到端方案

在开始本教程之前,请执行以下步骤:

  1. 登录到 Power BI 联机帐户,或者如果没有帐户,请注册免费试用版。
  2. 在租户中启用 Microsoft Fabric

在本教程中,你将在虚构 的 Wide World Importers 公司担任仓库开发人员的角色。 你将实现端到端数据仓库解决方案:

  1. 创建工作区
  2. 创建仓库
  3. 使用管道将数据从源引入数据仓库维度模型。
  4. 在仓库中创建具有 T-SQL 的表。
  5. Fabric 门户中通过 SQL 查询编辑器使用 T-SQL 加载数据
  6. 使用 SQL 查询编辑器克隆具有 T-SQL 的表。
  7. 使用存储过程 转换数据以创建聚合数据集。
  8. 使用 T-SQL 进行时间旅行,查看某个时间点的数据。
  9. 使用可视查询编辑器创建查询, 从数据仓库中检索结果。
  10. 分析笔记本中的数据
  11. 使用 SQL 查询编辑器创建和执行跨仓库查询
  12. 创建 DirectLake 语义模型和 Power BI 报表 以就地分析数据。
  13. 从 OneLake 目录生成报表
  14. 通过删除工作区和其他项来清理 教程资源。

数据仓库端到端体系结构

显示数据仓库端到端体系结构的图片。

数据源 - Microsoft Fabric 使连接到 Azure Data Services、其他云平台和本地数据源变得简单快捷。

引入 - Microsoft Fabric 管道提供超过 200 种连接器,利用数据流进行拖放即可进行数据转换,让你快速为组织生成见解。 快捷方式是 Microsoft Fabric 推出的一项新功能,让用户无需复制或移动现有数据即可连接现有数据。 有关快捷方式功能的更多详细信息,请参阅本教程后面的部分。

转换和存储 - Microsoft Fabric 在 Delta Lake 格式上标准化,这意味着 Microsoft Fabric 的所有引擎都可以读取和处理存储在 OneLake 中的同一据集,无需数据重复。 此存储允许你根据组织需求构建数据仓库或数据网格。 在进行转换时,可以选择使用管道/数据流的低代码或无代码体验,或是使用 T-SQL 的代码优先体验。

使用 - 使用行业领先的商业智能工具 Power BI 来报告和可视化来自仓库的数据。 每个仓库都有一个内置的 TDS 终结点,用于在需要时连接到其他报告工具并从中查询数据。 在本教程中,你将在示例仓库上创建语义模型,只需几个步骤即可开始在星型架构中可视化数据。

示例数据

在示例数据中,我们使用 Wide World Importers (WWI) 示例数据库。 为了演示我们的数据仓库端到端方案,我们生成了足够多的数据,以便抢先了解 Microsoft Fabric 平台的缩放和性能功能。

广域进口商(WWI)是一家总部位于旧金山湾地区的批发新奇商品进口商和分销商。 WWI 的客户大多是向个人转售的公司。 WWI还向美国各地的零售客户销售,如专卖店、超市、计算商店、旅游景点商店和一些个人。 WWI 通过推广 WWI 产品的代理网络向其他批发商销售。 若要了解有关公司配置文件和运营的详细信息,请参阅 适用于 Microsoft SQL 的 Wide World Importers 示例数据库

通常会将事务系统(或业务线应用程序)中的数据引入数据湖或数据仓库暂存区域。 但是,在本教程中,我们使用 WWI 提供的维度模型作为初始数据源。 我们将它用作源,将数据引入数据仓库并通过 T-SQL 进行转换。

数据模型

WWI 维度模型在星型架构中具有多个事实数据表。 在本教程中,你将重点介绍 fact_sale 表及其相关 维度 ,以演示端到端数据仓库方案:

此图显示了本教程中使用的数据模型,其中包括fact_sale表及其相关维度。

下一步