我为 ChatGPT 构建了一个开源隐私防火墙（100% 本地运行）

发布: 5天前 (2025年12月8日 GMT+8 08:19)

7 min read

原文: Dev.to

Source: Dev.to

概览

我认识的每位开发者每天都在使用 ChatGPT 或 Claude，而每位 CISO 都对潜在的合规违规或数据泄露通知感到恐慌。
并不是说 AI 本身不好，而是极其容易在不自觉的情况下泄露敏感数据：

客户邮件
API 密钥
含有令牌的日志
含有机密信息的堆栈跟踪
人力资源信息
员工姓名 / 内部 ID

我们都曾把东西粘贴到 ChatGPT 中，然后心想：“等一下…我真的该把这个发出去吗？”

PrivacyFirewall 是一个开源、优先本地的隐私防护盾，能在数据发送到任何 AI 工具之前拦截敏感信息。
👉 GitHub:

传统 DLP 的问题

传统的数据泄露防护（DLP）工具是为电子邮件、文件上传和网络流量设计的——它们并不能保护 AI 提示。当你把内容粘贴到 ChatGPT 时：

内容会立即离开你的浏览器
发送到第三方服务器
成为公司风险面的一部分

今天的大多数泄露并非恶意，而是意外。开发者粘贴日志，支持团队粘贴客户消息，HR 粘贴简历，工程师粘贴配置文件。粘贴后，信息就不复存在。

解决方案概述

PrivacyFirewall 在点击发送按钮之前拦截数据，让你有机会阻止错误。数据永远不会离开你的电脑。

关键特性

拦截风险粘贴事件（邮件、API 密钥、信用卡模式、令牌）
在输入时提醒 当文本看起来敏感时
可选 AI 模式 使用本地小型 Transformer（NER）
零云调用 —— 完全离线运行
Chrome 扩展 + 可选本地 FastAPI 代理
开源，采用 MIT 许可证

好处

✅ 符合合规要求 —— 没有数据离开你的机器
✅ 零延迟 —— 即时扫描，无网络请求
✅ 离线工作 —— 在航班、VPN、隔离系统上也可使用
✅ 无订阅费用 —— 永久免费运行

工作原理

PrivacyFirewall 由两层组成：

Lite 模式（无后端）

随 Chrome 扩展立即加载。
通过正则表达式检测：
- 电子邮件地址
- 电话号码
- JWT 令牌
- AWS 密钥
- 私钥块
- 信用卡模式
- IP 地址
- 哈希 / API 密钥

要求： 无需任何 Python、下载、模型或服务器。

Advanced 模式（可选本地 FastAPI 后端）

在 http://127.0.0.1:8765 运行 FastAPI 服务器。
使用 dslim/bert-base-NER Transformer 在设备上进行命名实体识别（NER）。
不需要互联网连接；推理在本地通过 Hugging Face 完成。

此模式能够捕获正则表达式无法检测的实体，例如：

人名
组织机构
地点
上下文线索

如果引擎离线，PrivacyFirewall 会自动回退到 Lite 模式，确保持续保护。

示例粘贴演示

输入	预期结果
`john.doe@example.com`	弹出 “检测到邮件” 模态框
`AKIAIOSFODNN7EXAMPLE`	被拦截为 AWS 访问密钥
`Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...`	被捕获为 JWT 令牌
“Meeting notes from Sarah Thompson at HR…”	Advanced 模式标记 `PERSON` 并给出警告

所有检测均在浏览器本地完成。

安装与快速入门

# Clone the repository
git clone https://github.com/privacyshield-ai/privacy-firewall.git

打开 Chrome → 扩展程序 → 启用 开发者模式。
点击 加载已解压的扩展程序，选择 privacy-firewall/src/extension。

（可选）运行 FastAPI 代理：

cd privacy-firewall
python -m uvicorn agent:app --host 127.0.0.1 --port 8765

打开 ChatGPT（或任何 AI 工具），粘贴敏感内容，观察警告/拦截。

完整说明请参见仓库的 README。

技术栈

Chrome Manifest V3（content scripts + background worker）
本地代理使用 FastAPI
Hugging Face Transformers（dslim/bert-base-NER）实现本地 NER
正则引擎实现确定性检测

当前重点 / 路线图

弹出窗口中的 UI 设置面板
自定义检测规则
支持 Slack、Jira、Notion AI
Firefox 支持
量化模型以加速推理并减小体积
将代理打包成小型桌面应用（Windows/macOS/Linux）
更好的脱敏而非直接拦截

FAQ 与社区

这会拖慢我的打字速度吗？
不会。Lite 模式完全在浏览器中运行，几乎没有开销；Advanced 模式只会增加本地 CPU 推理的少量负担。
我可以白名单某些模式吗？
可以。即将推出的 UI 将允许你添加自定义允许列表。
它能与 Claude、Gemini 或其他 AI 工具一起使用吗？
该扩展监控任何网页的粘贴事件，所以可以与任何 AI Web UI 配合使用。

我们期待以下群体的反馈：

安全工程师
AI 安全从业者
Chrome 扩展开发者
任何曾不小心把敏感数据粘贴到 AI 工具中的人 👀

立即尝试 🚀

⭐ 为仓库加星
在 Issues 区块留下你的反馈
如果有想法或改进，欢迎贡献代码

你是否曾不小心把敏感信息粘贴到 AI 工具中？感谢阅读——希望能让 AI 使用更安全。