分析师如何在 Power BI 中将混乱数据和仪表板转化为行动

发布: (2026年2月10日 GMT+8 00:22)
4 分钟阅读
原文: Dev.to

Source: Dev.to

在 Power BI 中准备和清洗数据

Power BI 包含 Power Query,这是一款强大的工具,可在分析之前准备和清洗数据。干净的数据有助于:

  • 产生更准确的计算结果。
  • 通过更好的组织,使数据更易于探索。
  • 简化导航并提升切片器性能。

第一步是转换已导入的数据,使其准备好使用。通过在 Power BI 菜单的 Queries 部分选择 Transform data 打开 Power Query 编辑器。

在 Power Query 中转换数据

重命名列

导入的表格通常会有不具描述性的列标题。为提升清晰度:

  1. 在 Power Query 中,点击 Use First Row as Header(位于表格主页图标下)。
  2. 核实列名是否正确,修正任何拼写错误并采用一致的命名约定(例如 PascalCase、snake_case 等)。

删除不必要的列

选中任何不需要的列,右键单击并选择 Remove。每一次更改都会显示在右侧的 Applied Steps 面板中。

删除重复项

如果某列应包含唯一值(例如交易 ID),可以消除重复行:

  1. 右键单击该列(例如 TransactionID)。
  2. 选择 Remove Duplicates

校正数据类型

Power Query 可能会误判数据类型(例如将数字存为文本)。修正方法:

  1. 点击列标题。
  2. 在列工具中,选择合适的数据类型(整数、十进制数、日期等)。

正确的数据类型对计算和汇总至关重要。

检测异常

使用 Column Distribution(视图 → 列分布)来发现数据中的离群值或异常模式。

常用 DAX 函数

以下是 Power BI 中常用的 DAX 函数,用于进行各种计算。

聚合函数

-- Sum all values in a column
Total Revenue = SUM(Orders[Amount])
-- Average of a column (ignores blanks)
Average Loyalty Score = AVERAGE(Customers[LoyaltyScore])
-- Count non‑blank rows in a column
Customer Count = COUNT(Customers[CustomerID])

基于行的函数

-- Count rows that meet a condition
Total Electronic Products =
CALCULATE(
    COUNTROWS(Products),
    Products[Category] = "Electronics"
)
-- Iterate over a table and sum an expression
Total Sales = 
SUMX(
    Sales,
    Sales[Quantity] * Sales[UnitPrice]
)

上下文操作函数

  • CALCULATE – 在修改后的过滤上下文中评估表达式。
  • FILTER – 返回满足指定条件的表。
  • CALENDAR – 创建日期表。
-- Generate a calendar table from July 1 2024 to July 31 2026
DateTable = CALENDAR(DATE(2024, 7, 1), DATE(2026, 7, 31))
-- Convert text to a date value
OrderDate = DATEVALUE(Orders[OrderDateText])

构建仪表板

Power BI 中的仪表板通过可视化讲述故事,突出关键洞察,供利益相关者探索。完成数据清洗、计算和度量创建后,就可以设计直观的仪表板,有效总结发现。

理解并遵循这些步骤,可帮助数据分析师高效工作,并利用 Power BI 从混乱的数据中提取可操作的洞察。

0 浏览
Back to Blog

相关文章

阅读更多 »

Power BI 中的模式与数据建模

引言 数据建模,顾名思义,包含对数据的重构以及从已清洗和结构化的数据中创建有洞察力的可视化。在 Power BI…