데이터 사이언스 스킬을 향상시키는 30일 차

발행: (2025년 12월 23일 오전 07:10 GMT+9)
3 min read
원문: Dev.to

Source: Dev.to

데이터 과학 스킬 향상 30일 차 커버 이미지

오늘 집중한 내용

오늘은 조용하지만 강력한 학습의 날이었습니다. 작동하는 것에 그치지 않고  그리고 어떻게 작동하는지를 이해하는 날이었죠.

하루 종일 Python에서 데이터 가져오기에 몰두했습니다. 파일부터 시작했어요—멋진 모델도, 대시보드도 없고, 단지 데이터가 Python에 어떻게 들어오는지만 배웠습니다.

배운 핵심 내용

  • with open()을 사용해 전체 텍스트 파일을 안전하게 읽기.
  • pd.read_excel()로 여러 시트를 가진 Excel 파일 가져오기.
  • sheet_name=None을 전달하면 모든 시트를 사전 형태로 반환합니다.
    “아… Python이 모든 시트를 사전으로 줬구나.” 라는 작은 성공이 크게 느껴졌습니다.

갑자기 Excel이 단순 파일이 아니라 DataFrame들의 구조화된 컬렉션이 되었습니다. 이름으로 접근 가능한 각각의 DataFrame—단순하고 깔끔하면서도 강력합니다.

데이터 시각화

데이터는 조용히 머물러서는 안 됩니다. Matplotlib을 이용해 숫자를 그림으로 바꾸기 시작했습니다. 시각적 패턴은 원시 값보다 더 많은 이야기를 전달합니다.

이 과정에서 호기심이 생겼습니다:

  • 더 나은 질문을 스스로 던지게 됨.
  • 예상치 못한 패턴을 발견함.
  • 추측을 멈추고 관찰을 시작함.

주요 교훈

  • 데이터는 마법처럼 나타나는 것이 아니라 의도적으로 가져와야 합니다.
  • 파일은 두렵지 않습니다—읽히길 기다리는 포맷일 뿐입니다.
  • 시각화는 장식이 아니라 이해를 위한 도구입니다.

내일 계획

  • 더 다양한 데이터 소스 탐색.
  • 추가 시각화 만들기.
  • 기본을 넘어서는 연습 문제 해결.

오늘은 데이터의 문을 여는 것이었다면, 내일은 그 문을 자신 있게 걸어가는 것입니다.

그리고 저는 이제 시작에 불과합니다.

— SP

Back to Blog

관련 글

더 보기 »

Python 데이터 과학 핸드북

기사 URL: https://jakevdp.github.io/PythonDataScienceHandbook/ 댓글 URL: https://news.ycombinator.com/item?id=46120611 포인트: 4 댓글: 0

Jupyter Notebook 시작

Jupyter Notebook이란? 파이썬 및 R, Julia와 같은 다른 언어를 커널을 통해 사용할 수 있는 인터랙티브 코딩 환경입니다. Jupyter의 모드 - Command Mode – 사용하여 …