第16天提升我的Data Science技能
发布: (2025年12月1日 GMT+8 06:44)
2 min read
原文: Dev.to
Source: Dev.to
Introduction to Statistics in Python – Measure of Center
在周末,我开始了 Introduction to Statistics in Python 课程。让我印象深刻的是数值汇总统计——measures of center(中心度量)。它们帮助我们概括数据,但选择能够真实代表数据的正确“平均值”非常重要;否则我们会被极端值误导。
Data can lie if you use the wrong average
想象有五个孩子的零用钱如下:
- ₦100
- ₦120
- ₦110
- ₦130
- ₦1,000,000
Mean vs. Median
- Mean – 当数据呈对称分布(均匀分布)时使用。
- Median – 当数据偏斜(包含非常大或非常小的值)时使用。
Real‑life example
招聘人员报告 median salary(中位数薪资) 而不是 mean salary(平均薪资),这样单个亿万富翁就不会扭曲薪酬预期。
再次学习这些内容让我对该主题有了更清晰的理解。即使在学习感觉沉重的日子里,我也感激自己比昨天更好地掌握了每一个概念。
— SP 🤍