第16天提升我的Data Science技能

发布: (2025年12月1日 GMT+8 06:44)
2 分钟阅读
原文: Dev.to

Source: Dev.to

Introduction to Statistics in Python – Measure of Center

在周末,我开始了 Introduction to Statistics in Python 课程。让我印象深刻的是数值汇总统计——measures of center(中心度量)。它们帮助我们概括数据,但选择能够真实代表数据的正确“平均值”非常重要;否则我们会被极端值误导。

Data can lie if you use the wrong average

想象有五个孩子的零用钱如下:

  • ₦100
  • ₦120
  • ₦110
  • ₦130
  • ₦1,000,000

Mean vs. Median

  • Mean – 当数据呈对称分布(均匀分布)时使用。
  • Median – 当数据偏斜(包含非常大或非常小的值)时使用。

Real‑life example

招聘人员报告 median salary(中位数薪资) 而不是 mean salary(平均薪资),这样单个亿万富翁就不会扭曲薪酬预期。

再次学习这些内容让我对该主题有了更清晰的理解。即使在学习感觉沉重的日子里,我也感激自己比昨天更好地掌握了每一个概念。

— SP 🤍

Back to Blog

相关文章

阅读更多 »

第1276天:职业攀升

星期六 在前往车站之前,我在当前的副项目上写了一些代码。取得了相当不错的进展,然后该出发了。Made i...

无状态 AI 应用背后的架构

项目一开始就做了一个看似冒险的决定:不使用后端数据库。当时并不需要持久化用户数据——获取用户的响应就是……

JWT Token 验证器挑战

概述 2019 年,Django 的会话管理框架中包含一个细微但灾难性的漏洞 CVE‑2019‑11358。该框架未能正确 inv...