简化数据结构

已完成

将数据从多个源导入 Power BI Desktop 中时,数据将保留其预定义的表和列名称。 您可能需要更改其中一些名称,使它们的格式保持一致、更易于处理,并且对用户而言更有意义。 您可以在 Power BI Desktop 中使用 Power Query 编辑器对这些名称进行更改并简化数据结构。

若要继续之前对模型中的初始数据进行调整的应用场景,您需要采取进一步操作来简化销售数据的结构,并准备好数据以为销售团队开发报表。 您已对列进行重命名,但现在您需要检查查询(表)的名称以确定是否可以进行任何改进。 您还需要查看列的内容,并替换任何需要更正的值。

重命名查询

最好将不常见或无用的查询名称更改为更明显或用户更熟悉的名称。 例如,如果您将产品事实表导入到 Power BI Desktop 中,并且查询名称显示为 FactProductTable,您可能需要将其更改为对用户更友好的名称,例如 Products。 同样,如果导入视图,此视图的名称可能会带有 v 前缀,例如 vProduct。 人们可能会发现此名称不清楚并且令人混淆,因此可能需要删除此前缀。

在本示例中,您检查了 TargetSales 查询的名称,意识到此名称是无用的,因为您将会有针对每年带有此名称的查询。 若要避免混淆,需要将年份添加到查询名称。

在 Power Query 编辑器中,在数据左侧的查询窗格中,选择想要重命名的查询。 右键单击查询,然后选择重命名。 编辑当前名称或键入新名称,然后按 Enter 键。

替换值

可以使用 Power Query 编辑器中的替换值功能,将所选列中的任何值替换为另一个值。

在本示例中,您会注意到,在 Attribute 列中,月份 December 拼写错误。 需要更正此拼写错误。 选择包含想要替换的值的列(在本示例中为 Attribute),然后选择转换选项卡上的替换值

要查找的值框中,输入想要替换的值的名称,在替换为框中,输入正确的值名称,然后选择确定。 在 Power Query 中,您无法像在 Excel 中一样选择一个单元格和更改一个值。

您可以在查询设置窗格中查看对数据进行重建格式和更正所采取的步骤列表。 完成要执行的所有步骤后,您可以选择关闭并应用以关闭 Power Query 编辑器,然后将更改应用到数据模型。 但是,可以采取进一步操作来清理和转换数据。

替换 null 值

有时,您可能会发现数据源包含 null 值。 例如,销售订单中的运费金额可能会有一个 null 值(只要它与零同义)。 如果此值保持为 null,将无法正确计算聚合。 一种解决方法是将 null 更改为零,这将生成更准确的运费平均值。 在此实例中,使用之前进行的相同步骤有助于您将 null 值替换为零。

删除重复项

还可以使用 Power Query 中的删除重复项功能从列中删除重复项,从而在所选列中仅保留唯一名称。

在本示例中,可以注意到 Category Name 列包含每个类别的重复项。 因此,需要创建包含唯一类别的表,并将它用于语义模型中。 您可以通过选择一列,右键单击列的标头,然后选择删除重复项选项来实现此操作。

可以考虑在删除重复项之前复制表。 复制选项位于上下文菜单的顶部,如以下屏幕截图所示。 如有需要,在删除重复项之前复制表使您能够比较表并能够使用这两个表。

命名表、列和值的最佳做法

表、列和值的命名约束没有固定的规则;但是,我们建议使用您的组织内常用的并且所有人都一致认同是常用术语的语言和缩写。

最佳做法是为表、列和度量值提供描述性的业务术语,并将下划线(“_”)替换为空格。 请务必保持缩写、前缀以及“number”和“ID”等词的一致性。如果不是在组织内常用的缩写,过短的缩写可能会导致混淆。

此外,可以删除可能在表名称中使用的前缀或后缀并改为以简单的格式对它们进行命名,这将有助于避免混淆。

替换值时,请尝试想象这些值将如何显示在报表中。 过长的值可能难以阅读并且难以融入视觉对象中。 过短的值可能难以理解。 只要文本适合视觉对象,避免对值使用缩写也是一个不错的主意。