什么是 Microsoft Fabric?

Microsoft Fabric 是一个数据分析平台,用于处理整个数据工作流,从收集和处理数据到生成报表和仪表板。 它通过数据工程、数据工厂、数据科学、实时智能、数据仓库和数据库等工作负载来合并数据摄取、转换、实时事件路由和可视化。

作为软件即服务(SaaS)平台,Fabric 使用 OneLake 集中数据存储。 它在整个过程中嵌入 AI 功能,因此无需手动集成服务,即可有效地将原始数据转换为可作的见解。

注释

  • "Fabric 分析师一日培训(FAIAD)研讨会是免费的,面向使用 Power BI 和 Fabric 的分析师,提供动手培训。" 获取使用 Fabric 分析数据和生成报表的实践经验。 研讨会涵盖了使用 Lakehouses、创建报表和分析 Fabric 环境中数据等关键概念。
  • 加入新的 Fabric 用户面板以共享反馈并帮助调整 Fabric 和 Power BI。 参与产品团队的调查和一对一会话。 在 Fabric 用户面板中了解详细信息并注册。

Fabric 的功能

Microsoft Fabric 提供了多种集成功能:

  • 特定于角色的工作负荷: 针对数据工程师、数据科学家、业务分析师和数据库管理员定制工具,每个工具都有专为工作流设计的界面。
  • OneLake: 所有 Fabric 工具都可以访问中央数据存储,无需在服务之间复制数据。
  • Copilot 支持: 一个 AI 助手,可帮助编写代码、生成见解并自动执行重复任务。
  • 与 Microsoft 365 集成: 将 Fabric 数据连接到 Excel、Teams 和其他Microsoft 365 应用程序。
  • Azure AI Foundry: 提供用于生成自定义机器学习解决方案的预生成 AI 模型和工具。
  • 统一数据管理: 集中式数据发现,简化了治理、共享和使用。

与 SaaS 基础统一

Microsoft Fabric 构建在 SaaS 平台上。 它将 Power BI、Azure Synapse Analytics、Azure 数据工厂等中的新组件和现有组件统一到单个环境中。

在 Fabric 的不同体验下,不同 Fabric 体验下的服务型软件基础示意图。

Fabric 的集成方法具有多种优势:

  • 从数据引入到报表的集成分析
  • 一致的用户友好体验
  • 轻松访问和重用所有资产
  • 统一的数据湖存储,用于将数据保留在其原始位置
  • 内置于每个工作流程中的 AI 辅助
  • 集中式管理和治理

Fabric 通过自动在套件中的所有项应用权限和继承数据敏感度标签,实现数据发现、管理和治理的集中化。 治理由 Purview 提供支持,它内置于 Fabric 中。 这种无缝集成使创建者能够专注于生成最佳工作,而无需管理底层基础结构。

Microsoft Fabric 的组件

Microsoft Fabric 提供以下工作负载,每个工作负载都针对特定角色和任务进行自定义:

  • Power BI - Power BI 使你能够连接到数据源、创建交互式图表和仪表板,以及在整个组织中共享见解。 这样,企业所有者就可以快速有效地访问 Fabric 中的所有数据,从而做出更注重数据的决策。 有关详细信息,请参阅 什么是 Power BI?

  • 数据库 - Fabric 中的数据库是开发人员友好的事务数据库,例如 Azure SQL 数据库,可用于在 Fabric 中轻松创建作数据库。 使用镜像功能,可以将各种系统中的数据汇集到 OneLake 中。 可以直接将现有数据资产复制到 Fabric 的 OneLake 中,包括来自 Azure SQL 数据库、Azure Cosmos DB、Azure Databricks、Snowflake 和 Fabric SQL 数据库的数据。 有关详细信息,请参阅 Microsoft Fabric 中的 SQL 数据库,Fabric 中的镜像是什么?

  • 数据工厂 - 数据工厂提供新式数据集成体验,用于从丰富的数据源引入、准备和转换数据。 它结合了 Power Query 的简单性,可以使用 200 多个本机连接器连接到本地和云中的数据源。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据工厂?

  • 行业解决方案 - Fabric 提供行业特定的数据解决方案,可满足独特的行业需求和挑战,包括数据管理、分析和决策。 有关详细信息,请参阅 Microsoft Fabric 中的行业解决方案。

  • 实时智能 - 实时智能分析实时到达的数据,例如,物联网传感器数据、应用程序日志或网站点击流。 它通过处理数据引入、转换、存储、建模、分析、可视化、跟踪、AI 以及实时操作,来实现从动态数据中获取见解、可视化信息并采取相应行动。 Real-Time Intelligence 中的 Real-Time 枢纽 提供了各种各样的无代码连接器,并将其汇集成一个组织数据目录,这些数据在 Fabric 中受到保护、治理和集成。 有关详细信息,请参阅 Fabric 中的实时智能是什么?

  • 数据工程 - Fabric 数据工程提供 Apache Spark 来处理大型数据集,以及用于编写和计划数据转换作业的笔记本和工具。 它使你能够创建、管理和优化基础结构,以便收集、存储、处理和分析大量数据。 Fabric Spark 与数据工厂的集成使你可以计划和协调笔记本和 Spark 作业。 有关详细信息,请参阅 Microsoft Fabric 中的数据工程是什么?

  • Fabric Data Science - Fabric Data Science 使你能够从 Fabric 生成、部署和作机器学习模型。 它与 Azure 机器学习集成以提供内置的试验跟踪和模型注册表。 数据科学家可以使用预测来丰富组织数据,业务分析师可以将这些预测集成到其 BI 报表中,从而从描述性见解向预测见解转变。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据科学?

  • Fabric 数据仓库 - Fabric 数据仓库提供行业领先的 SQL 性能和规模。 它将计算与存储分开,从而实现这两个组件的独立扩展。 此外,它还以 Delta Lake 开放格式原生存储数据。 有关详细信息,请参阅 什么是 Microsoft Fabric 中的数据仓库?

Fabric 可帮助组织和个人分析其数据,并创建报表、仪表板和机器学习模型。 它实现数据网格体系结构。 有关详细信息,请参阅 什么是数据网格?

OneLake:湖屋的统一

Microsoft Fabric 平台跨企业统一 OneLake 和 Lakehouse 体系结构。

OneLake

Data Lake 是所有 Fabric 工作负载的基础。 在 Fabric 中,此湖称为 OneLake。 OneLake 内置于平台中,充当所有组织数据的单个存储。

OneLake 基于 ADLS(Azure Data Lake Storage) Gen2 构建。 它提供单一的 SaaS 体验和一个面向整个租户的数据存储,为专业开发人员和普通开发者服务。 它简化了用户体验,无需了解复杂的基础结构详细信息,例如资源组、RBAC、Azure 资源管理器、冗余或区域。 无需 Azure 帐户即可使用 Fabric。

OneLake 通过提供统一的存储系统来防止数据孤岛,使数据发现、共享和一致的策略实施变得容易。 有关详细信息,请参阅 什么是 OneLake?

OneLake 和 Lakehouse 数据层次结构

OneLake 的分层设计简化了组织范围的管理。 默认情况下,Fabric 包括 OneLake,因此不需要预先预配。 每个租户获取一个统一的 OneLake,其中包含跨用户、区域和云的单个文件系统命名空间。 OneLake 将数据组织到容器中,以便轻松处理。 租户会映射到 OneLake 的根目录,且位于层次结构的顶层。 可以在租户中创建多个工作区(类似于文件夹)。

下图显示了 Fabric 如何在 OneLake 中存储数据。 每个租户可以有多个工作区,每个工作区中可以有多个湖屋。 湖屋是文件、文件夹、和表的集合,充当数据湖的数据库。 若要了解详细信息,请参阅 什么是湖屋?

租户工作区内湖屋和语义模型等项的层次结构示意图。

租户中的每个开发人员和业务部门都在 OneLake 中创建自己的工作区。 他们将数据引入 lakehouses 并开始处理、分析和协同处理这些数据,就像在 Microsoft Office 中使用 OneDrive 一样。

Fabric 计算引擎

所有 Microsoft Fabric 计算服务都预配置了 OneLake,类似于 Office 应用自动使用组织的 OneDrive。 数据工程、数据仓库、数据工厂、Power BI 和 Real-Time Intelligence 等体验使用 OneLake 作为其本机存储,而无需进行额外的设置。

不同 Fabric 体验都访问同一个 OneLake 数据存储的示意图。

OneLake 允许使用 快捷方式 功能立即装载现有的 PaaS 存储帐户。 无需迁移现有数据。 快捷方式提供对 Azure Data Lake Storage 中的数据的直接访问。 它们还可以在用户和应用程序之间轻松共享数据,而无需复制文件。 此外,您还可以为其他存储系统创建快捷方式,借助智能缓存分析跨云数据,以降低流出成本,并使数据更靠近计算资源。

Real-Time 中心:数据流的统一

实时中心是动态数据的基础位置。 它为流式处理数据提供统一的 SaaS 体验和租户范围的逻辑环境。 它列出来自每个源的数据,允许用户发现、引入、管理和响应数据。 它包含 KQL 数据库 表。 流包括 数据流Microsoft源 (例如 Azure 事件中心Azure IoT 中心Azure SQL 数据库(DB)更改数据捕获 (CDC)Azure Cosmos DB CDCAzure 数据资源管理器PostgreSQL DB CDC)、 构造事件工作区项事件OneLake 事件作业事件),以及 Azure 事件,包括 Azure Blob 存储事件 以及来自 Microsoft 365 或其他云服务的外部事件。

借助 Real-Time 中心,可以轻松地从各种源发现、引入、管理和使用动态数据,从而在一个位置协作和开发流式处理应用程序。 有关详细信息,请参阅 什么是 Real-Time 中心?

ISV 的 Fabric 解决方案

如果你是一家独立软件供应商(ISV),希望将解决方案与 Microsoft Fabric 集成,则可以根据所需的集成级别使用以下路径之一:

  • 互操作 - 将解决方案与 OneLake Foundation 集成,并与 Fabric 建立基本连接和互操作性。
  • 在 Fabric 上进行开发 - 在 Fabric 平台的基础上构建解决方案,或无缝地将 Fabric 的功能嵌入到现有应用程序中。 可以使用此选项轻松使用 Fabric 功能。
  • 构建 Fabric 工作负载 - 在 Fabric 中创建自定义的工作负载和体验,定制产品/服务,以最大限度地提高其在 Fabric 生态系统中的效果。

有关详细信息,请参阅 Fabric ISV 合作伙伴生态系统