适用于:✅Microsoft Fabric 中的数据工程和数据科学
从 Azure 门户创建 Microsoft Fabric 时,会自动将其添加到与用于创建容量的订阅关联的 Fabric 租户。 使用 Microsoft Fabric 中的简化设置,无需将容量关联到 Fabric 租户。 因为新创建的容量将列在“管理员设置”窗格中。 此配置使管理员可以更快开始为其企业分析团队设置容量。
若要更改容量中的数据工程/科学设置,必须具有该容量的管理员角色。 若要详细了解可在容量中分配给用户的角色,请参阅容量中的角色。
使用以下步骤管理 Microsoft Fabric 容量的数据工程/科学设置:
选择“设置”选项,打开 Fabric 帐户的“设置”窗格。 在“治理和见解”部分下选择 “管理门户 ”。
选择 “容量设置” 选项以展开菜单,然后选择 “构造容量 ”选项卡。此时应会看到你在租户中创建的容量。 选择要配置的容量。
导航到容量详细信息窗格,可在其中查看容量的使用情况和其他管理员控制。 导航到“数据工程/科学设置”部分,然后选择“打开 Spark 计算”。 配置以下参数:
注意
至少应将一个工作区附加到 Fabric 容量,以便通过 Fabric 容量管理门户浏览数据工程/科学设置。
管理员控制:禁用初学者池子功能
容量管理员现在可以选择在附加到容量的工作区中禁用入门池的使用。 禁用后,用户和工作区管理员将不再将初学者池视为计算选项。 相反,它们必须使用由容量管理员显式创建和管理的自定义池。
此功能为计算使用情况提供集中治理,确保更严格地控制计算大小、成本和计划行为。
小窍门
此设置在大型组织中特别有用,这些组织希望对计算模式进行标准化,并通过默认初始资源池避免任意使用。
管理控制:作业级别启用开关
Microsoft Fabric 支持 Spark VCore 的3×突发,允许单个作业临时使用比基础容量更多的计算核心。 这通过允许完全容量利用率来提高活动突发期间的作业性能。
作为容量管理员,您现在可以使用管理门户中提供的 “禁用作业级突发” 开关来控制此行为。
位置:
Admin Portal → Capacity Settings → [Select Capacity] → Data Engineering/Science Settings → Spark Compute行为:
- 启用(默认):单个 Spark 作业可以使用完全的突发限制(最多达到 3 倍的 Spark VCores)。
- 禁用:单个 Spark 作业受限于基本容量分配,保持并发性并防止垄断。
注意
仅当在 Fabric 容量上运行 Spark 作业时,此开关才可用。 如果启用了 自动缩放计费 选项,则会自动禁用此开关,因为:
- 自动缩放计费遵循纯粹的按需付费模式。
- 没有平滑窗口来允许平衡使用突发,并使其在 24 小时内均匀分配。
- 突发功能是预留容量的一部分,并不属于按需自动扩展计算功能。
用例和示例
| 情景 | 设置 | 行为 |
|---|---|---|
| 繁重的 ETL 工作负荷 | 突发已启用(默认值) | 作业可以使用整个突发容量(例如 F64 中的 384 Spark VCore)。 |
| 多用户交互式笔记本 | 已禁用突发 | 作业使用量被限制(例如在 F64 中限制为 128 个 Spark VCore),从而提高并发性。 |
| 自动缩放计费已启用 | 突发控制 不可用 | 所有 Spark 的使用均按需计费,不会超出基本容量。 |
小窍门
使用此开关 可以针对吞吐量或并发进行优化:
- 为 大型作业和管道保持开启突发模式。
- 对于具有许多用户的 交互式或共享环境 ,请将其禁用。
Microsoft Fabric 中用于数据工程和数据科学的容量池
在 Spark 设置的 池列表 部分中,单击 添加 为您的 Fabric 容量创建一个 自定义池。
您已进入池创建页面,您可以在此页面上:
- 指定 池名称
- 选择 节点系列 和 节点大小
- 设置 最小节点和最大节点数
- 启用/禁用 自动缩放 和 执行器的动态分配
选择“ 创建 ”以保存设置。
注意
容量级自定义池的启动延迟为 2-3 分钟。 若要更快地启动 Spark 会话(<5 秒),请使用启动器池(如果已启用)。
创建完成后,容量池将在以下项中可用:
- 工作区设置中的 “池选择 ”下拉列表
- 工作区中的 “环境计算设置” 页
这可实现集中式计算治理。 管理员可以创建标准化池,还可以选择 禁用工作区级自定义,从而阻止工作区中的管理员修改池设置或创建自己的池设置。