针对数据分析师的 Git 与 GitHub 指南
发布: (2026年1月17日 GMT+8 16:59)
4 min read
原文: Dev.to
Source: Dev.to
什么是 Git,为什么版本控制很重要
版本控制是一种系统,用于记录文件或文件集随时间的更改,以便以后能够检索特定的版本。
Git是一种 分布式版本控制系统 (DVCS)。与文件被锁定的中心服务器不同,每个开发者的电脑上都有完整的代码历史副本。
为什么这很重要?
- “撤销”按钮: 如果你在凌晨 2 点把代码弄坏了,可以立刻把项目恢复到晚上 10 点的状态。
- 协作: 多位数据分析师可以同时在同一个文件上工作。Git 使用数学算法将这些更改合并(combine)在一起。
- 分支: 你可以创建平行的“宇宙”(分支)来测试想法,而不会破坏主工作代码。
- 上下文: 它告诉你 谁 写了某行代码、何时 写的,以及重要的 为什么(通过提交信息)。
关于 Git 与 GitHub 的说明
- Git是工具(安装在你机器上的软件)。
- GitHub是服务(在云端托管 Git 仓库的网站)。可以把它想象成:Git 是 MP3,GitHub 是 Spotify。
如何跟踪更改(Git 工作流)
在 Git 中跟踪更改遵循三阶段过程:
- 工作目录(Working Directory): 你编辑文件的地方。
- 暂存区(Staging Area / Index): 你选择要保存的内容的地方。
- 仓库(Repository / HEAD): 代码的永久存储位置。
常用命令
# 初始化一个新的 Git 仓库
git init
# 显示文件的状态
git status
步骤 A – 暂存
# 添加指定文件
git add main.py
# 或添加当前目录下所有已修改的文件
git add .
步骤 B – 提交
# 创建带有信息的永久快照
git commit -m "Implement the quadratic formula function"
最佳实践: 使用祈使句编写提交信息(例如 “Add feature” 而不是 “Added feature”)。
如何将代码推送到 GitHub
“推送(push)”会把本地仓库的历史上传到远程服务器(GitHub)。
前提条件: 在 GitHub.com 上创建一个 空的 仓库。
步骤 A – 关联本地与远程
git remote add origin https://github.com/cyrusz55/my-project.git
步骤 B – 推送代码
git push -u origin main
origin– 远程名称(GitHub)。main– 你要发送的分支(以前叫master)。-u– 设置上游,使以后只需运行git push而无需额外参数。
如何从 GitHub 拉取代码
“拉取(pull)”会把 GitHub 上的数据下载到你的电脑。常见的两种情形如下。
情形 A – 从零开始(git clone)
git clone https://github.com/cyrusz55/my-project.git
此命令会初始化仓库、创建远程链接,并一次性下载完整历史。
情形 B – 更新已有代码(git pull)
git pull origin main
获取新更改并将其合并到本地文件中。
摘要速查表
| 目标 | 命令 |
|---|---|
| 启动 Git | git init |
| 检查状态 | git status |
| 暂存文件 | git add . |
| 保存快照 | git commit -m "message" |
| 下载仓库 | git clone |
| 上传更改 | git push |
| 更新本地 | git pull |
祝编码愉快! 🚀