
[Azure PL300 Certified] Power BI 数据清理、转换和加载
例如,你可能有两个表,其中一个表有 300 行,另一个表有 100 行,在追加查询后,最后将有 400 行。在合并查询时,你会将列从一个表(或查询)添加到另一个表(或查询)中。转到 Power Query 编辑器功能区上的“开始”,然后选择“合并查询”下拉菜单,从中可以选择“将查询合并为新查询”。此选择将打开一个新窗口,从中可以选择要从下拉列表中合并的表,然后选择两个表都具有的列。若要完成此任务,
清理数据具有以下优点:
- 度量值和列在执行聚合和计算时会生成更准确的结果。
- 表经过了整理,用户可以从中以直观的方式查找数据。
- 重复项会被删除,使数据导航更为简单。 它还将生成可用于切片器和筛选器的列。
- 一个复杂的列可以被拆分为两个更简单的列。 可以将多列合并成一列,易于阅读。
- 可以将代码和整数替换为可读的值。
怎么进入Power Query编辑器
Power Query 编辑器仅对数据的特定视图进行更改,因此,你无需担心会对原始数据源造成任何更改
Power Query入门
识别列标头和名称
提升标头
当表在 Power BI Desktop 中创建后,Power Query 编辑器会假设所有数据都属于表行。 但是,数据源的第一行可能会包含列名称,需要将第一个表行提升为列标头。
可以通过两种方式提升标头:
- 在“开始”选项卡上选择“将第一行用作标头”选项,
- 选择“Column1”旁边的下拉菜单按钮,然后选择“将第一行用作标头”。
重命名列
删除前几行
删除列
逆透视列
关于逆透视和列透视相关实例请看这篇文章: TODO
列透视
关于逆透视和列透视相关实例请看这篇文章: TODO
更改Power BI模型列数据类型
更改列数据类型有以下两种方法
选择存在问题的列,在“转换”选项卡中选择“数据类型”,然后从列表中选择正确的数据类型
选择列标头旁的数据类型图标,然后从列表中选择正确的数据类型
将多个表合并为一个表
在以下情况下,可以将表合并为一个表:
-
存在过多的表,使得难以导航一个过于复杂的语义模型。
-
多个表具有一个类似的角色。
-
一个表只有一两个可以放进不同表中的列。
-
想在一个自定义列中使用来自不同表的多个列。
可以通过两种不同的方式合并表:合并和追加。
追加查询
在追加查询时,你会将数据行添加到另一个表或查询中。 例如,你可能有两个表,其中一个表有 300 行,另一个表有 100 行,在追加查询后,最后将有 400 行。 在合并查询时,你会将列从一个表(或查询)添加到另一个表(或查询)中。 若要合并两个表,必须有一个列是两个表之间的关键值。
开始合并查询之前,可以从表中删除此任务不需要的无关列。 若要完成此任务,请将每个表的格式设置为只有四个包含你的相关信息的列,并对它们进行重命名,使它们全都具有相同的列标头
合并查询
合并查询时,你将基于表之间通用的列将数据从多个表合并到一个表中。 此过程类似于 SQL 中的 JOIN 子句。
转到 Power Query 编辑器功能区上的“开始”,然后选择“合并查询”下拉菜单,从中可以选择“将查询合并为新查询”。 此选择将打开一个新窗口,从中可以选择要从下拉列表中合并的表,然后选择两个表都具有的列
此外,还可以选择如何联接两个表,这也是类似 SQL 中的 JOIN 语句的一个过程。 这些联接选项包括:
-
左外部 - 显示第一个表中的所有行以及第二个表中的匹配行。
-
完全外部 -显示两个表中的所有行。
-
内部 - 显示两个表之间匹配的行。
更多推荐
所有评论(0)