Microsoft Fabric 中的数据工厂 是下一代 Azure 数据工厂,旨在通过更简单、更强大的方法处理最复杂的数据集成挑战。
本指南可帮助你了解这两个服务之间的主要差异,以便为企业做出正确的选择。 我们将引导你了解新功能、有哪些不同,以及 Fabric 带来的优势。
结构数据工厂是下一代 Azure 数据工厂,旨在简化和增强数据集成工作流。 本部分介绍 Fabric 数据工厂的主要功能和优势。
准备好探索迁移选项了吗? 请查看 我们的迁移指南。
并排比较功能
下面是 Azure 数据工厂与 Fabric 数据工厂之间核心功能的对比。 我们突出显示了更改的内容、新增功能以及保持不变的内容。
| Azure 数据工厂 | Fabric 中的数据工厂 | 区别 |
|---|---|---|
| 管道 | 管道 | 更好的集成:Fabric 中的管道能够立即与 Lakehouse、数据仓库和其他 Fabric 服务无缝协作。 构造管道包括更多基于 SaaS 的活动,在 JSON 定义中有所不同。 |
| 映射数据流 | 数据流 Gen2 | 更易于使用:Dataflow Gen2 提供更简单的生成转换体验。 我们一直向 Gen2 添加更多映射数据流功能。 |
| 活动 | 活动 | 即将推出更多活动:我们正在努力将所有最喜欢的 ADF 活动引入 Fabric。 此外,还可获得 Office 365 Outlook 活动等新活动,这些活动在 ADF 中不可用。 有关详细信息,请参阅 我们的活动概述 。 |
| 数据集 | 仅限联网 | 更简单的方法:没有更复杂的数据集配置。 对于 Fabric 中的数据工厂,可以使用连接链接到数据源并开始工作。 Fabric 省略了数据集,直接在活动中定义数据属性。 |
| 链接服务 | 连接 | 更直观:连接的工作方式类似于链接服务,但更易于设置和管理。 |
| 触发器 | 计划和文件事件触发器 | 内置调度:使用 Fabric 的调度器和 Reflex 事件自动运行您的管道。 文件事件触发器在 Fabric 中本机工作,无需进行额外的设置。 Fabric 将触发器集成到其激活器框架中,与 ADF 的独立触发器不同。 |
| 发布 | 保存并运行 | 无发布步骤:在 Fabric 中,完全跳过发布步骤。 只需选择“保存”以存储工作,或选择“运行”以立即保存和执行管道。 |
| Autoresolve 和 Azure Integration Runtime | 不需要 | 简化的体系结构:无需管理集成运行时。 Fabric 会为你处理计算。 |
| 自承载集成运行时 | 本地数据网关 | 相同的本地访问:使用熟悉的本地数据网关连接到本地数据。 在 本地数据访问指南中了解详细信息。 |
| Azure-SSIS 集成运行时 | 待定 | Fabric 中未来的功能:我们仍在致力于在 Fabric 中实现 SSIS 集成的设计。 |
| 托管虚拟网络和专用终结点 | 待定。 | Fabric 中未来的功能:我们仍在为 Fabric 中的托管虚拟网络和专用终结点进行集成。 |
| 表达式语言 | 表达式语言 | 相同的表达式:现有的表达式知识直接传输。 语法几乎完全相同。 |
| 身份验证类型 | 身份验证类型 | 更多选项:所有常用的 ADF 身份验证方法都在 Fabric 中工作,此外我们添加了新的身份验证类型。 |
| CI/CD | CI/CD | 即将推出:结构数据工厂即将推出完整的 CI/CD 功能。 |
| ARM 模板导出/导入 | 另存为 | 快速复制:在 Fabric 中,使用“另存为”快速复制用于开发或测试的管道。 |
| 监视 | 监控中心 + 运行历史记录 | 高级监视:监视中心提供跨工作区见解和更好的深入分析功能的新式体验。 |
| 调试 | 交互模式 | 简化调试:Fabric 消除了 ADF 的调试模式。 始终处于交互模式。 |
| 变更数据捕获 (CDC) | 复制作业 | 增量数据移动:Fabric 通过数据复制作业而非 CDC 工件来管理增量数据移动。 |
| Azure Synapse Link | 镜像 | 数据复制:Fabric 将 Azure Synapse Link 替换为用于数据复制的镜像功能。 |
| 执行管道活动 | “调用管道”活动 | 跨平台调用:Fabric 使用跨平台调用增强了 ADF 的执行管道活动。 |
Fabric Data Factory的关键特性
在 Fabric 数据工厂中,生成管道、数据流和其他数据工厂项变得特别简单和快速,因为微软革命性的 AI 功能 Co-Pilot 的原生集成。 借助 Copilot for 数据工厂,可以使用自然语言轻松定义数据集成项目。
原生湖仓与数据仓库集成
Fabric 数据工厂的最大优点之一是它如何与数据平台连接。 Lakehouse 和数据仓库在数据流程中既作为数据源又作为目标,这使得构建集成数据项目变得轻而易举。
使用 Office 365 的智能电子邮件通知
需要让团队了解最新情况吗? 借助 Office 365 Outlook 活动,你可以发送有关管道运行、活动状态和结果的自定义电子邮件通知,所有这些通知都是使用简单的配置。 不再经常检查仪表板或编写自定义通知代码。
简化的数据连接体验
Fabric 的现代化 获取数据体验可让你快速设置复制管道并创建新连接。 你将花费更少的时间进行配置,而有更多时间将数据传输到需要的地方。
CI/CD 体验中的易用性改进
在 Fabric 中,CI/CD 体验比 Azure 数据工厂或 Synapse 更轻松、更灵活。 Fabric 中的 CI/CD 和 ARM 模板之间没有连接,因此可以轻松挑选 Fabric 工作区的各个部分进行签入、签出、验证和协作。 在 ADF 和 Synapse 中,CI/CD 的唯一选择是使用自己的 Git 存储库。 但是,在 Fabric 中,可以选择使用不需要自带外部 Git 存储库的内置部署管道功能。
更高级别的监控和观测
在 Fabric Data Factory 中的监控体验,您会真正感受到不同。 监控中心为您提供所有工作负载的完整视图,并且可以深入分析任何活动以获取详细见解。 跨工作区分析是内置的,因此你可以在整个组织中看到大局。
在对复制活动进行故障排除时,您会喜欢详细分解视图。 选择“运行详细信息”按钮(眼镜图标)以查看所发生的情况。 持续时间细目显示每个阶段花费的时间,从而使性能优化更加轻松。
快速流水线复制
需要创建类似的管道? “ 另存为 ”功能允许以秒为单位复制任何现有管道。 它非常适合用于创建开发版本、测试变体或设置类似的工作流。
相关内容
有关详细信息,请参阅以下资源: