Power BI:将混乱的数据转化为可操作的洞察
Source: Dev.to
在组织内部,数据分析师承担着从各种数据集提取意义的关键任务。以原始形式存在的数据并不能提供可用于推动有意义变革的实质性洞见。这正是分析师发挥作用的地方:他们对数据进行清洗、分析和可视化。为完成这些任务,分析师使用多种分析工具——其中行业中最广泛使用的之一是 Power BI。
本文演示了数据分析师和数据专业人士如何使用 Power BI 将混乱的数据转化为可操作的洞见,内容包括:
- 使用 Power Query 进行数据转换
- 使用 DAX(Data Analysis Expressions)进行分析
- 创建可视化和仪表板
什么是 Power BI?
Power BI 是 Microsoft Power Platform 的商业分析和智能工具。它可以让您:
- 分析数据
- 创建交互式可视化报告和仪表板
Power BI 可以直接从 Microsoft Store 下载 – 下载 Power BI。
主要界面元素
| 区域 | 描述 |
|---|---|
| Ribbon(顶部) | 组织为多个选项卡,如 Home、Insert、Modeling、View、Optimize 和 Help |
| Navigation pane(左侧) | 包含 Report view、Data view、Model view 和 DAX query / TMDL view |
| Visualizations pane | 让您选择可视化类型(柱形图、折线图、地图、表格等),并提供格式化可视化和管理视觉级过滤器的选项 |
| Fields pane | 显示已加载数据集中的表、列和度量值 |
| Filters pane | 用于在不同层级(视觉级、页面级、报告级)应用过滤器 |
加载数据
Power BI 的直观导航允许分析师加载多种格式的文件,例如:
- CSV、文本、Excel
- Dataflow、Dataverse 等
获取数据的方法:
Home → Get Data
数据转换与 Power Query
在组织中获取的数据经常存在不一致、缺失值、重复或错误。数据转换是对这些数据进行清洗、重塑和准备的过程,使其准确、一致并适合分析。
Power BI 包含 Power Query,这是一款专用于准备和转换数据的工具。
如何打开 Power Query:
Home → Transform Data
这将在单独的窗口中打开 Power Query 编辑器。
典型的转换工作流程
- 选择要修改的行/列。
- 使用编辑器功能区执行诸如 删除、拆分、合并、更改数据类型 等操作。
- 完成后,点击 Close & Apply 将更改推送回 Power BI。
Source: …
使用 DAX 分析数据
在数据清理完成后,下一步是分析——检查数据以发现支持决策的模式、趋势和洞察。在 Power BI 中,分析主要使用 数据分析表达式 (Data Analysis Expressions, DAX),这是一种专为数据模型计算设计的公式语言。
五大 DAX 函数类别
| 类别 | 用途 |
|---|---|
| 聚合 | 汇总数据(例如 SUM、AVERAGE、SUMX、AVERAGEX) |
| 逻辑 | 测试条件并返回 TRUE/FALSE |
| 计算与筛选 | 根据筛选器或上下文动态执行计算 |
| 文本 | 操作文本列 |
| 日期与时间 | 处理日期、期间以及时间智能 |
度量值 vs. 列
- 度量值 (Measure) – 在当前筛选上下文下即时计算。
- 列 (Column) – 在数据模型刷新时逐行计算。
创建新度量值或列:
Modeling → New Measure (or) New Column
常用 DAX 函数
聚合函数
-- SUM
Total Sales = SUM(Sales[Amount])
-- AVERAGE
Average Sales = AVERAGE(Sales[Amount])
-- SUMX (row‑by‑row expression)
Total Revenue = SUMX(Sales, Sales[Quantity] * Sales[UnitPrice])
-- AVERAGEX
Average Revenue per Transaction = AVERAGEX(Sales, Sales[Quantity] * Sales[UnitPrice])
-- MAX
Max Sale = MAX(Sales[Amount])
-- MIN
Min Sale = MIN(Sales[Amount])
逻辑和条件函数
-- IF
Result = IF( Sales[Quantity] > 10, "Large", "Small" )
-- AND
Result = IF( AND( Sales[Quantity] > 10, Sales[Region] = "East" ), "Large East", "Other" )
-- OR
Result = IF( OR( Sales[Quantity] > 10, Sales[Region] = "East" ), "Large or East", "Other" )
-- NOT
Result = IF( NOT( Sales[Quantity] > 10 ), "Not Large", "Large" )
多个条件也可以使用 &&(AND)和 ||(OR)运算符来表达:
Result = IF( Sales[Quantity] > 10 && Sales[Region] = "East", "Large East", "Other" )
高级函数
-- CALCULATE (changes filter context)
Result = CALCULATE( SUM(Sales[Amount]), Sales[Region] = "West" )
-- FILTER (returns a table that meets a condition)
WestSales = FILTER( Sales, Sales[Region] = "West" )
摘要
Power BI 提供了一个无缝的工作流,从 数据摄取 → 使用 Power Query 进行转换 → 使用 DAX 进行分析 → 可视化。通过掌握导航、数据加载选项、Power Query 编辑器和 DAX 函数,分析师可以将混乱的原始数据转化为可操作的洞察和引人注目的仪表板。
文本函数
| Function | Description |
|---|---|
| CONCATENATE | 将两个文本值连接在一起。 |
| CONCATENATEX | 使用分隔符将列或表中的文本连接起来。 |
| LEN | 计算文本中的字符数。 |
| UPPER / LOWER | 将文本分别转换为大写和小写。 |
| PROPER | 将每个单词的首字母大写。 |
| TRIM | 删除文本中多余的空格(单词之间的单个空格除外)。 |
日期函数
| 函数 | 描述 |
|---|---|
| TODAY | 返回当前日期。 |
| NOW | 返回当前日期和时间。 |
| DATE | 根据年份、月份和日期组件创建日期。 |
| DAY | 提取日期的天部分。 |
| MONTH | 提取日期的月份数字。 |
| DATEDIFF | 计算两个日期之间的差异。示例:DATEDIFF(lower_date, higher_date, DAY) |
| DATEADD | 按指定的天、月或年数移动日期。语法:shifted_date = DATEADD(date_column, operation, DAY/MONTH/YEAR),其中 operation 为要移动的单位数(例如 +1、-4)。 |
可视化概述
可视化是使用图表、图形、表格、地图和仪表板等视觉元素对数据进行图形化呈现,以清晰、有效地传达信息。在使用 DAX 创建度量值后,您可以在 Power BI 的 Reports 视图中对其进行可视化。
可视化度量值的步骤
- 从 Visualization pane 中选择一个可视化对象。
- 在 Fields pane 中找到所需的度量值并将其拖放到可视化对象上。
- (可选)从 Filters pane 应用筛选器,以细化可视化显示的内容。
Power BI 可视化类型
| 可视化 | 使用场景 |
|---|---|
| 卡片 | 显示单个关键数值(例如,总销售额、利润)。 |
| 条形图 | 使用水平条形比较各类别的数值。 |
| 柱形图 | 使用垂直条形显示随类别或时间的变化。 |
| 折线图 | 使用相连的数据点展示随时间的趋势。 |
| 饼图 | 显示整体的比例。 |
| 环形图 | 带有空心中心的饼图变体。 |
| 地图 | 基于地理位置可视化数据。 |
| 树状图 | 使用嵌套矩形显示层次结构数据。 |
| 散点图 | 在两个数值轴上绘制数值以揭示关系。 |
| 切片器 | 为报表提供交互式过滤器。 |
| 交互式切片器 | 条形图、折线图和散点图也可以充当切片器。 |
所有这些可视化均可在 Visualization pane 中找到。
仪表板
仪表板 是一个单页的可视化展示,呈现监控绩效和支持快速决策所需的关键信息。它通过将最重要的可视化(根据分析目标选择)安排在同一视图中来构建。
结束语
无论所属领域或数据类型如何,分析师都可以通过遵循结构化工作流程并利用强大的工具,从数据中提取意义。Power BI 是一个领先的平台,因为它提供了:
- 直观的界面。
- 支持多种数据源。
- 通过 Power Query 提供强大的转换功能。
- 使用 DAX 进行高级计算和分析。
- 在 Visualization pane 上拥有丰富的可视化选项。
这些特性共同使 Power BI 成为任何希望将原始数据转化为可操作洞察的数据分析师或专业人士的宝贵资产。