提升我的数据科学技能的第30天

发布: (2025年12月23日 GMT+8 06:10)
3 min read
原文: Dev.to

Source: Dev.to

Cover image for Day 30 of improving my Data Science skills

我今天的重点

今天感觉像是那种安静却充满力量的学习日——不只是让东西运行,而是明白了为什么以及如何运行。

我把整天都花在 Python 中导入数据 上。先从文件开始——没有花哨的模型,没有仪表盘——只学习数据如何进入 Python。

我学到的关键点

  • 使用 with open() 安全读取整个文本文件。
  • 使用 pd.read_excel() 导入包含多个工作表的 Excel 文件。
  • 传入 sheet_name=None 会返回 每个工作表组成的字典
    “哦……Python 把每个工作表都交给了我一个字典。” 这小小的成功感很大。

突然之间,Excel 不再只是一个文件。它变成了 DataFrame 的结构化集合,每个都可以通过名称访问——简单、清晰,却又强大。

数据可视化

数据不该保持沉默。借助 Matplotlib,我开始把数字转化为图像。可视化的模式解释的内容远超原始数值本身。

这激发了好奇心:

  • 你开始提出更好的问题。
  • 你注意到意想不到的模式。
  • 你不再盲目猜测,而是开始观察。

收获

  • 数据不会凭空出现;它是有意导入的。
  • 文件并不可怕——它们只是等待被读取的格式。
  • 可视化不是装饰,而是理解的手段。

明日计划

  • 探索更多数据来源。
  • 创建更多可视化。
  • 进行超出基础的练习,以提升我的理解。

如果说今天是打开数据之门,那么明天就是自信地走进去。

而我才刚刚开始。

— SP

Back to Blog

相关文章

阅读更多 »

Jupyter Notebook 启动

什么是 Jupyter Notebook?交互式编码环境,支持 Python 以及通过 kernels 的其他语言,如 R、Julia。Jupyter 的模式——Command Mode——用于…