提升我的数据科学技能的第30天
发布: (2025年12月23日 GMT+8 06:10)
3 min read
原文: Dev.to
Source: Dev.to

我今天的重点
今天感觉像是那种安静却充满力量的学习日——不只是让东西运行,而是明白了为什么以及如何运行。
我把整天都花在 Python 中导入数据 上。先从文件开始——没有花哨的模型,没有仪表盘——只学习数据如何进入 Python。
我学到的关键点
- 使用
with open()安全读取整个文本文件。 - 使用
pd.read_excel()导入包含多个工作表的 Excel 文件。 - 传入
sheet_name=None会返回 每个工作表组成的字典。
“哦……Python 把每个工作表都交给了我一个字典。” 这小小的成功感很大。
突然之间,Excel 不再只是一个文件。它变成了 DataFrame 的结构化集合,每个都可以通过名称访问——简单、清晰,却又强大。
数据可视化
数据不该保持沉默。借助 Matplotlib,我开始把数字转化为图像。可视化的模式解释的内容远超原始数值本身。
这激发了好奇心:
- 你开始提出更好的问题。
- 你注意到意想不到的模式。
- 你不再盲目猜测,而是开始观察。
收获
- 数据不会凭空出现;它是有意导入的。
- 文件并不可怕——它们只是等待被读取的格式。
- 可视化不是装饰,而是理解的手段。
明日计划
- 探索更多数据来源。
- 创建更多可视化。
- 进行超出基础的练习,以提升我的理解。
如果说今天是打开数据之门,那么明天就是自信地走进去。
而我才刚刚开始。
— SP