我为 ChatGPT 构建了一个开源隐私防火墙(100% 本地运行)
Source: Dev.to
概览
我认识的每位开发者每天都在使用 ChatGPT 或 Claude,而每位 CISO 都对潜在的合规违规或数据泄露通知感到恐慌。
并不是说 AI 本身不好,而是极其容易在不自觉的情况下泄露敏感数据:
- 客户邮件
- API 密钥
- 含有令牌的日志
- 含有机密信息的堆栈跟踪
- 人力资源信息
- 员工姓名 / 内部 ID
我们都曾把东西粘贴到 ChatGPT 中,然后心想:“等一下…我真的该把这个发出去吗?”
PrivacyFirewall 是一个开源、优先本地的隐私防护盾,能在数据发送到任何 AI 工具之前拦截敏感信息。
👉 GitHub:
传统 DLP 的问题
传统的数据泄露防护(DLP)工具是为电子邮件、文件上传和网络流量设计的——它们并不能保护 AI 提示。当你把内容粘贴到 ChatGPT 时:
- 内容会立即离开你的浏览器
- 发送到第三方服务器
- 成为公司风险面的一部分
今天的大多数泄露并非恶意,而是意外。开发者粘贴日志,支持团队粘贴客户消息,HR 粘贴简历,工程师粘贴配置文件。粘贴后,信息就不复存在。
解决方案概述
PrivacyFirewall 在点击发送按钮之前拦截数据,让你有机会阻止错误。数据永远不会离开你的电脑。
关键特性
- 拦截风险粘贴事件(邮件、API 密钥、信用卡模式、令牌)
- 在输入时提醒 当文本看起来敏感时
- 可选 AI 模式 使用本地小型 Transformer(NER)
- 零云调用 —— 完全离线运行
- Chrome 扩展 + 可选本地 FastAPI 代理
- 开源,采用 MIT 许可证
好处
- ✅ 符合合规要求 —— 没有数据离开你的机器
- ✅ 零延迟 —— 即时扫描,无网络请求
- ✅ 离线工作 —— 在航班、VPN、隔离系统上也可使用
- ✅ 无订阅费用 —— 永久免费运行
工作原理
PrivacyFirewall 由两层组成:
Lite 模式(无后端)
- 随 Chrome 扩展立即加载。
- 通过正则表达式检测:
- 电子邮件地址
- 电话号码
- JWT 令牌
- AWS 密钥
- 私钥块
- 信用卡模式
- IP 地址
- 哈希 / API 密钥
要求: 无需任何 Python、下载、模型或服务器。
Advanced 模式(可选本地 FastAPI 后端)
- 在
http://127.0.0.1:8765运行 FastAPI 服务器。 - 使用
dslim/bert-base-NERTransformer 在设备上进行命名实体识别(NER)。 - 不需要互联网连接;推理在本地通过 Hugging Face 完成。
此模式能够捕获正则表达式无法检测的实体,例如:
- 人名
- 组织机构
- 地点
- 上下文线索
如果引擎离线,PrivacyFirewall 会自动回退到 Lite 模式,确保持续保护。
示例粘贴演示
| 输入 | 预期结果 |
|---|---|
john.doe@example.com | 弹出 “检测到邮件” 模态框 |
AKIAIOSFODNN7EXAMPLE | 被拦截为 AWS 访问密钥 |
Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9... | 被捕获为 JWT 令牌 |
| “Meeting notes from Sarah Thompson at HR…” | Advanced 模式标记 PERSON 并给出警告 |
所有检测均在浏览器本地完成。
安装与快速入门
# Clone the repository
git clone https://github.com/privacyshield-ai/privacy-firewall.git
- 打开 Chrome → 扩展程序 → 启用 开发者模式。
- 点击 加载已解压的扩展程序,选择
privacy-firewall/src/extension。 - (可选)运行 FastAPI 代理:
cd privacy-firewall python -m uvicorn agent:app --host 127.0.0.1 --port 8765 - 打开 ChatGPT(或任何 AI 工具),粘贴敏感内容,观察警告/拦截。
完整说明请参见仓库的 README。
技术栈
- Chrome Manifest V3(content scripts + background worker)
- 本地代理使用 FastAPI
- Hugging Face Transformers(
dslim/bert-base-NER)实现本地 NER - 正则引擎实现确定性检测
当前重点 / 路线图
- 弹出窗口中的 UI 设置面板
- 自定义检测规则
- 支持 Slack、Jira、Notion AI
- Firefox 支持
- 量化模型以加速推理并减小体积
- 将代理打包成小型桌面应用(Windows/macOS/Linux)
- 更好的脱敏而非直接拦截
FAQ 与社区
-
这会拖慢我的打字速度吗?
不会。Lite 模式完全在浏览器中运行,几乎没有开销;Advanced 模式只会增加本地 CPU 推理的少量负担。 -
我可以白名单某些模式吗?
可以。即将推出的 UI 将允许你添加自定义允许列表。 -
它能与 Claude、Gemini 或其他 AI 工具一起使用吗?
该扩展监控任何网页的粘贴事件,所以可以与任何 AI Web UI 配合使用。
我们期待以下群体的反馈:
- 安全工程师
- AI 安全从业者
- Chrome 扩展开发者
- 任何曾不小心把敏感数据粘贴到 AI 工具中的人 👀
立即尝试 🚀
- ⭐ 为仓库加星
- 在 Issues 区块留下你的反馈
- 如果有想法或改进,欢迎贡献代码
你是否曾不小心把敏感信息粘贴到 AI 工具中?感谢阅读——希望能让 AI 使用更安全。