针对数据分析师的 Git 与 GitHub 指南

发布: (2026年1月17日 GMT+8 16:59)
4 min read
原文: Dev.to

Source: Dev.to

什么是 Git,为什么版本控制很重要

版本控制是一种系统,用于记录文件或文件集随时间的更改,以便以后能够检索特定的版本。

Git是一种 分布式版本控制系统 (DVCS)。与文件被锁定的中心服务器不同,每个开发者的电脑上都有完整的代码历史副本。

为什么这很重要?

  • “撤销”按钮: 如果你在凌晨 2 点把代码弄坏了,可以立刻把项目恢复到晚上 10 点的状态。
  • 协作: 多位数据分析师可以同时在同一个文件上工作。Git 使用数学算法将这些更改合并(combine)在一起。
  • 分支: 你可以创建平行的“宇宙”(分支)来测试想法,而不会破坏主工作代码。
  • 上下文: 它告诉你 写了某行代码、何时 写的,以及重要的 为什么(通过提交信息)。

关于 Git 与 GitHub 的说明

  • Git是工具(安装在你机器上的软件)。
  • GitHub是服务(在云端托管 Git 仓库的网站)。可以把它想象成:Git 是 MP3,GitHub 是 Spotify。

如何跟踪更改(Git 工作流)

在 Git 中跟踪更改遵循三阶段过程:

  • 工作目录(Working Directory): 你编辑文件的地方。
  • 暂存区(Staging Area / Index): 你选择要保存的内容的地方。
  • 仓库(Repository / HEAD): 代码的永久存储位置。

常用命令

# 初始化一个新的 Git 仓库
git init
# 显示文件的状态
git status

步骤 A – 暂存

# 添加指定文件
git add main.py

# 或添加当前目录下所有已修改的文件
git add .

步骤 B – 提交

# 创建带有信息的永久快照
git commit -m "Implement the quadratic formula function"

最佳实践: 使用祈使句编写提交信息(例如 “Add feature” 而不是 “Added feature”)。

如何将代码推送到 GitHub

“推送(push)”会把本地仓库的历史上传到远程服务器(GitHub)。

前提条件: 在 GitHub.com 上创建一个 空的 仓库。

步骤 A – 关联本地与远程

git remote add origin https://github.com/cyrusz55/my-project.git

步骤 B – 推送代码

git push -u origin main
  • origin – 远程名称(GitHub)。
  • main – 你要发送的分支(以前叫 master)。
  • -u – 设置上游,使以后只需运行 git push 而无需额外参数。

如何从 GitHub 拉取代码

“拉取(pull)”会把 GitHub 上的数据下载到你的电脑。常见的两种情形如下。

情形 A – 从零开始(git clone

git clone https://github.com/cyrusz55/my-project.git

此命令会初始化仓库、创建远程链接,并一次性下载完整历史。

情形 B – 更新已有代码(git pull

git pull origin main

获取新更改并将其合并到本地文件中。

摘要速查表

目标命令
启动 Gitgit init
检查状态git status
暂存文件git add .
保存快照git commit -m "message"
下载仓库git clone
上传更改git push
更新本地git pull

祝编码愉快! 🚀

Back to Blog

相关文章

阅读更多 »

Git Bash 与 GitHub 初学者入门

什么是 Git?Git 是一个免费、开源的版本控制系统,用于随时间跟踪代码或任何文件的更改。它让开发者能够:- 在项目上工作……