Git for Data Scientists & Data Engineers — 我的第一本入门指南 (Git Bash + GitHub)
发布: (2026年1月17日 GMT+8 21:49)
5 min read
原文: Dev.to
Source: Dev.to
嗨,我是 Charles Ndungu。我最近开始学习数据科学和分析。之前从未使用过 Git,但我想分享我第一次使用 Git 和 GitHub 的经历,逐步讲解,以便像我一样的其他初学者能够跟随。
代码仓库:
TL;DR
Git 跟踪文件的更改。GitHub 在线存储您跟踪的项目。了解基本流程:
init → add → commit → push → pull
这已经足以让您自信地开始工作并与他人共享成果。
为什么 Git 很重要(简短)
- 可复现性 – 你可以回到任何之前的版本。
- 协作 – 多人可以一起工作而不会相互覆盖。
- 安全性 – 在分支上实验,撤销错误。
- 专业性 – 数据团队中这是预期的做法。
您需要的工具
- Windows(本步骤使用 Git Bash)– macOS/Linux 用户可以使用 Terminal。
- 一个 GitHub 账户
- 已安装 Git Bash
- (可选) VS Code 用于编辑文件
Very simple mental model
| Concept | Explanation |
|---|---|
| Local folder | 你电脑上的项目 |
| git | 监视文件夹并记录更改的工具 |
| commit | 已保存的快照 |
| remote (origin) | 项目在 GitHub 上的副本 |
| push | 将你的提交上传到 GitHub |
| pull | 从 GitHub 下载更改 |
第一步 — 安装 Git Bash(Windows)— 快速
- 从官方站点下载 → 选择 Windows。
- 运行安装程序 → 接受默认设置。出现提示时,选择 OpenSSH。
- 从 开始 → Git → Git Bash 打开 Git Bash。
第2步 — 最小化设置(一次性)
打开 Git Bash 并运行:
git --version
git config --global user.name "Your Name"
git config --global user.email "you@example.com"
git config --list
第3步 — 第一个本地项目 — 我运行的确切命令
# create project folder and enter it
mkdir ~/git-basics-practice
cd ~/git-basics-practice
# create a tiny file
echo "hello from git bash" > hello.txt
# start Git in this folder
git init
# check status
git status
# track the file
git add hello.txt
# save a snapshot
git commit -m "Add hello.txt"
# check history
git log --oneline
Step 4 — 创建 GitHub 仓库并推送(真实时刻)
- 在 GitHub 上点击 + → New repository。
- 将其命名为
git-basics-practice。 - 不要 初始化 README 或
.gitignore。
认证说明
- GitHub 不再接受在命令行中使用账户密码。如果提示,请使用 个人访问令牌 (PAT) 替代密码。
- 或者,设置 SSH 密钥(长期推荐):将公钥添加到 GitHub → Settings → SSH and GPG keys。
推送本地仓库
git remote add origin https://github.com/your-username/git-basics-practice.git
git branch -M main
git push -u origin main
故障排除 — 我看到的真实情况(以及如何修复)
fatal: User canceled device code authentication– 如果你关闭了浏览器提示,Git 可能会回退到要求输入用户名/PAT。重新运行git push并使用 PAT 或设置 SSH。Permission denied (publickey)– GitHub 上缺少 SSH 密钥。将你的id_ed25519.pub添加到 GitHub → Settings → SSH keys。404在浏览器中打开仓库时 – 检查仓库名称是否准确以及是否为私有。我曾经在远程 URL 末尾多了一个.(...git-basics-practice..git),导致仓库名带有尾部点并出现令人困惑的 404。始终使用git remote -v验证。
第5步 — 拉取更改(下载)
如果有人编辑了仓库或你在 GitHub 上进行编辑,请使用以下命令将更改拉下来:
git pull origin main
简短速查表(记住的命令)
git init # start tracking a folder
git status # see file status
git add # stage file
git commit -m "msg" # save snapshot
git log --oneline # view history
git remote -v # show remotes
git push -u origin main # upload commits
git pull origin main # download commits
git checkout -b name # create + switch branch
一个小小的真实教训(我的生涩新手时刻)
我成功推送了,但当我在浏览器中打开我的仓库时,出现了 404 错误。我后来发现我的远程 URL 多了一个点(git-basics-practice..git),导致仓库名称末尾出现了一个点。Git 仍然接受了推送,但常用的浏览器链接(没有那个点)会返回 404。如果遇到 404,运行 git remote -v 并确保 URL 完全符合你的预期。

