Git for Data Scientists & Data Engineers — 我的第一本入门指南 (Git Bash + GitHub)

发布: (2026年1月17日 GMT+8 21:49)
5 min read
原文: Dev.to

Source: Dev.to

Charles

嗨,我是 Charles Ndungu。我最近开始学习数据科学和分析。之前从未使用过 Git,但我想分享我第一次使用 Git 和 GitHub 的经历,逐步讲解,以便像我一样的其他初学者能够跟随。

代码仓库:

TL;DR

Git 跟踪文件的更改。GitHub 在线存储您跟踪的项目。了解基本流程:

init → add → commit → push → pull

这已经足以让您自信地开始工作并与他人共享成果。

为什么 Git 很重要(简短)

  • 可复现性 – 你可以回到任何之前的版本。
  • 协作 – 多人可以一起工作而不会相互覆盖。
  • 安全性 – 在分支上实验,撤销错误。
  • 专业性 – 数据团队中这是预期的做法。

您需要的工具

  • Windows(本步骤使用 Git Bash)– macOS/Linux 用户可以使用 Terminal。
  • 一个 GitHub 账户
  • 已安装 Git Bash
  • (可选) VS Code 用于编辑文件

Very simple mental model

ConceptExplanation
Local folder你电脑上的项目
git监视文件夹并记录更改的工具
commit已保存的快照
remote (origin)项目在 GitHub 上的副本
push将你的提交上传到 GitHub
pull从 GitHub 下载更改

第一步 — 安装 Git Bash(Windows)— 快速

  1. 从官方站点下载 → 选择 Windows
  2. 运行安装程序 → 接受默认设置。出现提示时,选择 OpenSSH
  3. 开始 → Git → Git Bash 打开 Git Bash

第2步 — 最小化设置(一次性)

打开 Git Bash 并运行:

git --version
git config --global user.name "Your Name"
git config --global user.email "you@example.com"
git config --list

第3步 — 第一个本地项目 — 我运行的确切命令

# create project folder and enter it
mkdir ~/git-basics-practice
cd ~/git-basics-practice

# create a tiny file
echo "hello from git bash" > hello.txt

# start Git in this folder
git init

# check status
git status

# track the file
git add hello.txt

# save a snapshot
git commit -m "Add hello.txt"

# check history
git log --oneline

Step 4 — 创建 GitHub 仓库并推送(真实时刻)

  1. 在 GitHub 上点击 + → New repository
  2. 将其命名为 git-basics-practice
  3. 不要 初始化 README 或 .gitignore

认证说明

  • GitHub 不再接受在命令行中使用账户密码。如果提示,请使用 个人访问令牌 (PAT) 替代密码。
  • 或者,设置 SSH 密钥(长期推荐):将公钥添加到 GitHub → Settings → SSH and GPG keys

推送本地仓库

git remote add origin https://github.com/your-username/git-basics-practice.git
git branch -M main
git push -u origin main

故障排除 — 我看到的真实情况(以及如何修复)

  • fatal: User canceled device code authentication – 如果你关闭了浏览器提示,Git 可能会回退到要求输入用户名/PAT。重新运行 git push 并使用 PAT 或设置 SSH。
  • Permission denied (publickey) – GitHub 上缺少 SSH 密钥。将你的 id_ed25519.pub 添加到 GitHub → Settings → SSH keys
  • 404 在浏览器中打开仓库时 – 检查仓库名称是否准确以及是否为私有。我曾经在远程 URL 末尾多了一个 ....git-basics-practice..git),导致仓库名带有尾部点并出现令人困惑的 404。始终使用 git remote -v 验证。

第5步 — 拉取更改(下载)

如果有人编辑了仓库或你在 GitHub 上进行编辑,请使用以下命令将更改拉下来:

git pull origin main

简短速查表(记住的命令)

git init                 # start tracking a folder
git status               # see file status
git add                  # stage file
git commit -m "msg"      # save snapshot
git log --oneline        # view history
git remote -v           # show remotes
git push -u origin main # upload commits
git pull origin main    # download commits
git checkout -b name    # create + switch branch

一个小小的真实教训(我的生涩新手时刻)

我成功推送了,但当我在浏览器中打开我的仓库时,出现了 404 错误。我后来发现我的远程 URL 多了一个点(git-basics-practice..git),导致仓库名称末尾出现了一个点。Git 仍然接受了推送,但常用的浏览器链接(没有那个点)会返回 404。如果遇到 404,运行 git remote -v 并确保 URL 完全符合你的预期。

GitHub 404 lesson

Back to Blog

相关文章

阅读更多 »

Rapg:基于 TUI 的密钥管理器

我们都有这种经历。你加入一个新项目,首先听到的就是:“在 Slack 的置顶消息里查找 .env 文件”。或者你有多个 .env …

技术是赋能者,而非救世主

为什么思考的清晰度比你使用的工具更重要。Technology 常被视为一种魔法开关——只要打开,它就能让一切改善。新的 software,...

踏入 agentic coding

使用 Copilot Agent 的经验 我主要使用 GitHub Copilot 进行 inline edits 和 PR reviews,让我的大脑完成大部分思考。最近我决定 t...