分析师如何在 Power BI 中将混乱数据和仪表板转化为行动
Source: Dev.to
在 Power BI 中准备和清洗数据
Power BI 包含 Power Query,这是一款强大的工具,可在分析之前准备和清洗数据。干净的数据有助于:
- 产生更准确的计算结果。
- 通过更好的组织,使数据更易于探索。
- 简化导航并提升切片器性能。
第一步是转换已导入的数据,使其准备好使用。通过在 Power BI 菜单的 Queries 部分选择 Transform data 打开 Power Query 编辑器。
在 Power Query 中转换数据
重命名列
导入的表格通常会有不具描述性的列标题。为提升清晰度:
- 在 Power Query 中,点击 Use First Row as Header(位于表格主页图标下)。
- 核实列名是否正确,修正任何拼写错误并采用一致的命名约定(例如 PascalCase、snake_case 等)。
删除不必要的列
选中任何不需要的列,右键单击并选择 Remove。每一次更改都会显示在右侧的 Applied Steps 面板中。
删除重复项
如果某列应包含唯一值(例如交易 ID),可以消除重复行:
- 右键单击该列(例如 TransactionID)。
- 选择 Remove Duplicates。
校正数据类型
Power Query 可能会误判数据类型(例如将数字存为文本)。修正方法:
- 点击列标题。
- 在列工具中,选择合适的数据类型(整数、十进制数、日期等)。
正确的数据类型对计算和汇总至关重要。
检测异常
使用 Column Distribution(视图 → 列分布)来发现数据中的离群值或异常模式。
常用 DAX 函数
以下是 Power BI 中常用的 DAX 函数,用于进行各种计算。
聚合函数
-- Sum all values in a column
Total Revenue = SUM(Orders[Amount])
-- Average of a column (ignores blanks)
Average Loyalty Score = AVERAGE(Customers[LoyaltyScore])
-- Count non‑blank rows in a column
Customer Count = COUNT(Customers[CustomerID])
基于行的函数
-- Count rows that meet a condition
Total Electronic Products =
CALCULATE(
COUNTROWS(Products),
Products[Category] = "Electronics"
)
-- Iterate over a table and sum an expression
Total Sales =
SUMX(
Sales,
Sales[Quantity] * Sales[UnitPrice]
)
上下文操作函数
CALCULATE– 在修改后的过滤上下文中评估表达式。FILTER– 返回满足指定条件的表。CALENDAR– 创建日期表。
-- Generate a calendar table from July 1 2024 to July 31 2026
DateTable = CALENDAR(DATE(2024, 7, 1), DATE(2026, 7, 31))
-- Convert text to a date value
OrderDate = DATEVALUE(Orders[OrderDateText])
构建仪表板
Power BI 中的仪表板通过可视化讲述故事,突出关键洞察,供利益相关者探索。完成数据清洗、计算和度量创建后,就可以设计直观的仪表板,有效总结发现。
理解并遵循这些步骤,可帮助数据分析师高效工作,并利用 Power BI 从混乱的数据中提取可操作的洞察。