为大型数据配置语义模型
当处理非常大型的数据源时,需要采用不同的数据加载策略。 在本单元中,我们将介绍如何启用大型语义模型存储格式,以及如何配置增量刷新。 这些功能可以让大型语义模型以更易管理的速度和规模进行刷新。
大型语义模型存储格式
使用 Microsoft Fabric 中的大型语义模型存储格式,能够高效地处理更大的数据源。 这种格式非常适合需要更多内存和处理能力的复杂分析模型。 此功能使语义模型能够超越 10GB 的限制。 具体的限制可能会有所不同,因为容量或 Fabric 管理员会决定大型语义模型的限制。 启用此功能非常简单,只需在工作区设置中选中一个选项框即可。
如果语义模型继续增大并且逐渐消耗更多内存,请务必配置增量刷新。
提示
请参阅文档,了解有关 大型语义模型的详细信息。
增量刷新
通过增量刷新,可以仅刷新自上次刷新以来已更改或新增的数据。 此功能减少了数据刷新所需的时间和资源,非常适合需要频繁更新的大型数据源。
假设你的销售表非常庞大,刷新语义模型需要很长时间。 如果需要保持数据的最新状态,可以配置增量刷新,仅刷新新增或更新的交易数据。
启用增量刷新时,首先需要在 Power Query 中定义参数并使用这些参数筛选行。 应用后,可以在 Power BI Desktop 中配置该表的增量刷新策略。 还可以选择配置该表以通过 DirectQuery 获取最新数据。 若要利用此功能,语义模型必须已发布到受支持的 Fabric 工作区。
提示
请参阅文档,详细了解 语义模型的增量刷新。
分区
增量刷新侧重于仅刷新已更改或新增的数据,而分区则涉及将整个表划分为更小的段。 分区操作是将大型表拆分为更小、更易管理的部分,这些部分称为分区。 每个分区都可以独立处理,从而提高查询性能和可管理性。
例如,可以为销售表的每个月或每个季度创建分区,使查询能够针对特定分区,而不是针对整个数据集。
若要启用分区,可以使用 SQL Server Management Studio (SSMS) 或表格编辑器等工具。
提示
请参阅文档,了解有关 使用 XMLA 终结点进行高级增量刷新分区的详细信息。