Azure 数据工厂与结构数据工厂之间的差异

Microsoft Fabric 中的数据工厂 是下一代 Azure 数据工厂,旨在通过更简单、更强大的方法处理最复杂的数据集成挑战。

本指南可帮助你了解这两个服务之间的主要差异,以便为企业做出正确的选择。 我们将引导你了解新功能、有哪些不同,以及 Fabric 带来的优势。

结构数据工厂是下一代 Azure 数据工厂,旨在简化和增强数据集成工作流。 本部分介绍 Fabric 数据工厂的主要功能和优势。

准备好探索迁移选项了吗? 请查看 我们的迁移指南

并排比较功能

下面是 Azure 数据工厂与 Fabric 数据工厂之间核心功能的对比。 我们突出显示了更改的内容、新增功能以及保持不变的内容。

Azure 数据工厂 Fabric 中的数据工厂 区别
管道 管道 更好的集成:Fabric 中的管道能够立即与 Lakehouse、数据仓库和其他 Fabric 服务无缝协作。 构造管道包括更多基于 SaaS 的活动,在 JSON 定义中有所不同。
映射数据流 数据流 Gen2 更易于使用:Dataflow Gen2 提供更简单的生成转换体验。 我们一直向 Gen2 添加更多映射数据流功能。
活动 活动 即将推出更多活动:我们正在努力将所有最喜欢的 ADF 活动引入 Fabric。 此外,还可获得 Office 365 Outlook 活动等新活动,这些活动在 ADF 中不可用。 有关详细信息,请参阅 我们的活动概述
数据集 仅限联网 更简单的方法:没有更复杂的数据集配置。 对于 Fabric 中的数据工厂,可以使用连接链接到数据源并开始工作。 Fabric 省略了数据集,直接在活动中定义数据属性。
链接服务 连接 更直观:连接的工作方式类似于链接服务,但更易于设置和管理。
触发器 计划和文件事件触发器 内置调度:使用 Fabric 的调度器和 Reflex 事件自动运行您的管道。 文件事件触发器在 Fabric 中本机工作,无需进行额外的设置。 Fabric 将触发器集成到其激活器框架中,与 ADF 的独立触发器不同。
发布 保存并运行 无发布步骤:在 Fabric 中,完全跳过发布步骤。 只需选择“保存”以存储工作,或选择“运行”以立即保存和执行管道。
Autoresolve 和 Azure Integration Runtime 不需要 简化的体系结构:无需管理集成运行时。 Fabric 会为你处理计算。
自承载集成运行时 本地数据网关 相同的本地访问:使用熟悉的本地数据网关连接到本地数据。 在 本地数据访问指南中了解详细信息。
Azure-SSIS 集成运行时 待定 Fabric 中未来的功能:我们仍在致力于在 Fabric 中实现 SSIS 集成的设计。
托管虚拟网络和专用终结点 待定。 Fabric 中未来的功能:我们仍在为 Fabric 中的托管虚拟网络和专用终结点进行集成。
表达式语言 表达式语言 相同的表达式:现有的表达式知识直接传输。 语法几乎完全相同。
身份验证类型 身份验证类型 更多选项:所有常用的 ADF 身份验证方法都在 Fabric 中工作,此外我们添加了新的身份验证类型。
CI/CD CI/CD 即将推出:结构数据工厂即将推出完整的 CI/CD 功能。
ARM 模板导出/导入 另存为 快速复制:在 Fabric 中,使用“另存为”快速复制用于开发或测试的管道。
监视 监控中心 + 运行历史记录 高级监视:监视中心提供跨工作区见解和更好的深入分析功能的新式体验。
调试 交互模式 简化调试:Fabric 消除了 ADF 的调试模式。 始终处于交互模式。
变更数据捕获 (CDC) 复制作业 增量数据移动:Fabric 通过数据复制作业而非 CDC 工件来管理增量数据移动。
Azure Synapse Link 镜像 数据复制:Fabric 将 Azure Synapse Link 替换为用于数据复制的镜像功能。
执行管道活动 “调用管道”活动 跨平台调用:Fabric 使用跨平台调用增强了 ADF 的执行管道活动。

Fabric Data Factory的关键特性

在 Fabric 数据工厂中,生成管道、数据流和其他数据工厂项变得特别简单和快速,因为微软革命性的 AI 功能 Co-Pilot 的原生集成。 借助 Copilot for 数据工厂,可以使用自然语言轻松定义数据集成项目。

原生湖仓与数据仓库集成

Fabric 数据工厂的最大优点之一是它如何与数据平台连接。 Lakehouse 和数据仓库在数据流程中既作为数据源又作为目标,这使得构建集成数据项目变得轻而易举。

显示湖屋和数据仓库来源选项卡的屏幕截图。

显示湖屋和数据仓库目标选项卡的屏幕截图。

使用 Office 365 的智能电子邮件通知

需要让团队了解最新情况吗? 借助 Office 365 Outlook 活动,你可以发送有关管道运行、活动状态和结果的自定义电子邮件通知,所有这些通知都是使用简单的配置。 不再经常检查仪表板或编写自定义通知代码。

显示 office 365 outlook 活动的屏幕截图。

简化的数据连接体验

Fabric 的现代化 获取数据体验可让你快速设置复制管道并创建新连接。 你将花费更少的时间进行配置,而有更多时间将数据传输到需要的地方。

显示一种现代而简便的“获取数据”体验的屏幕截图。

显示如何创建新连接的屏幕截图。

CI/CD 体验中的易用性改进

在 Fabric 中,CI/CD 体验比 Azure 数据工厂或 Synapse 更轻松、更灵活。 Fabric 中的 CI/CD 和 ARM 模板之间没有连接,因此可以轻松挑选 Fabric 工作区的各个部分进行签入、签出、验证和协作。 在 ADF 和 Synapse 中,CI/CD 的唯一选择是使用自己的 Git 存储库。 但是,在 Fabric 中,可以选择使用不需要自带外部 Git 存储库的内置部署管道功能。

更高级别的监控和观测

在 Fabric Data Factory 中的监控体验,您会真正感受到不同。 监控中心为您提供所有工作负载的完整视图,并且可以深入分析任何活动以获取详细见解。 跨工作区分析是内置的,因此你可以在整个组织中看到大局。

显示监视中心和数据工厂项目的屏幕截图。

在对复制活动进行故障排除时,您会喜欢详细分解视图。 选择“运行详细信息”按钮(眼镜图标)以查看所发生的情况。 持续时间细目显示每个阶段花费的时间,从而使性能优化更加轻松。

显示管道复制监视结果提供复制活动细分详情的屏幕截图。

显示复制数据详细信息的屏幕截图。

快速流水线复制

需要创建类似的管道? “ 另存为 ”功能允许以秒为单位复制任何现有管道。 它非常适合用于创建开发版本、测试变体或设置类似的工作流。

显示 Fabric 管道中的“另存为”的屏幕截图。

有关详细信息,请参阅以下资源: