데이터 사이언스 기술을 향상시키는 16일 차
Source: Dev.to
파이썬 통계 입문 – 중심 측도
주말에 Introduction to Statistics in Python 강의를 시작했습니다. 저에게 눈에 띈 것은 수치 요약 통계, 즉 중심 측도였습니다. 중심 측도는 데이터를 요약하는 데 도움이 되지만, 데이터를 진정으로 대표하는 올바른 “평균”을 선택하는 것이 매우 중요합니다. 그렇지 않으면 극단값에 속아버릴 수 있습니다.
잘못된 평균을 사용하면 데이터가 거짓말을 할 수 있습니다
다섯 아이들의 용돈을 생각해 보세요:
- ₦100
- ₦120
- ₦110
- ₦130
- ₦1,000,000
평균 vs. 중앙값
- Mean – 데이터가 대칭적(고르게 퍼져 있을 때)일 때 사용합니다.
- Median – 데이터가 왜곡되어(매우 크거나 작은 값이 포함될 때) 있을 때 사용합니다.
실제 예시
채용 담당자는 평균 급여가 아니라 median salary(중앙값 급여)를 보고합니다. 그래서 한 명의 억만장자가 급여 기대치를 왜곡하지 않게 됩니다.
이 내용을 다시 배우면서 주제를 더 명확히 이해하게 되었습니다. 학습이 무겁게 느껴지는 날에도, 어제보다 더 잘 이해하게 된 모든 개념에 감사함을 느낍니다.
— SP 🤍