我为 ChatGPT 构建了一个开源隐私防火墙(100% 本地运行)

发布: (2025年12月8日 GMT+8 08:19)
7 min read
原文: Dev.to

Source: Dev.to

概览

我认识的每位开发者每天都在使用 ChatGPT 或 Claude,而每位 CISO 都对潜在的合规违规或数据泄露通知感到恐慌。
并不是说 AI 本身不好,而是极其容易在不自觉的情况下泄露敏感数据:

  • 客户邮件
  • API 密钥
  • 含有令牌的日志
  • 含有机密信息的堆栈跟踪
  • 人力资源信息
  • 员工姓名 / 内部 ID

我们都曾把东西粘贴到 ChatGPT 中,然后心想:“等一下…我真的该把这个发出去吗?”

PrivacyFirewall 是一个开源、优先本地的隐私防护盾,能在数据发送到任何 AI 工具之前拦截敏感信息。
👉 GitHub:

传统 DLP 的问题

传统的数据泄露防护(DLP)工具是为电子邮件、文件上传和网络流量设计的——它们并不能保护 AI 提示。当你把内容粘贴到 ChatGPT 时:

  1. 内容会立即离开你的浏览器
  2. 发送到第三方服务器
  3. 成为公司风险面的一部分

今天的大多数泄露并非恶意,而是意外。开发者粘贴日志,支持团队粘贴客户消息,HR 粘贴简历,工程师粘贴配置文件。粘贴后,信息就不复存在。

解决方案概述

PrivacyFirewall 在点击发送按钮之前拦截数据,让你有机会阻止错误。数据永远不会离开你的电脑。

关键特性

  • 拦截风险粘贴事件(邮件、API 密钥、信用卡模式、令牌)
  • 在输入时提醒 当文本看起来敏感时
  • 可选 AI 模式 使用本地小型 Transformer(NER)
  • 零云调用 —— 完全离线运行
  • Chrome 扩展 + 可选本地 FastAPI 代理
  • 开源,采用 MIT 许可证

好处

  • ✅ 符合合规要求 —— 没有数据离开你的机器
  • ✅ 零延迟 —— 即时扫描,无网络请求
  • ✅ 离线工作 —— 在航班、VPN、隔离系统上也可使用
  • ✅ 无订阅费用 —— 永久免费运行

工作原理

PrivacyFirewall 由两层组成:

Lite 模式(无后端)

  • 随 Chrome 扩展立即加载。
  • 通过正则表达式检测:
    • 电子邮件地址
    • 电话号码
    • JWT 令牌
    • AWS 密钥
    • 私钥块
    • 信用卡模式
    • IP 地址
    • 哈希 / API 密钥

要求: 无需任何 Python、下载、模型或服务器。

Advanced 模式(可选本地 FastAPI 后端)

  • http://127.0.0.1:8765 运行 FastAPI 服务器。
  • 使用 dslim/bert-base-NER Transformer 在设备上进行命名实体识别(NER)。
  • 不需要互联网连接;推理在本地通过 Hugging Face 完成。

此模式能够捕获正则表达式无法检测的实体,例如:

  • 人名
  • 组织机构
  • 地点
  • 上下文线索

如果引擎离线,PrivacyFirewall 会自动回退到 Lite 模式,确保持续保护。

示例粘贴演示

输入预期结果
john.doe@example.com弹出 “检测到邮件” 模态框
AKIAIOSFODNN7EXAMPLE被拦截为 AWS 访问密钥
Bearer eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...被捕获为 JWT 令牌
“Meeting notes from Sarah Thompson at HR…”Advanced 模式标记 PERSON 并给出警告

所有检测均在浏览器本地完成。

安装与快速入门

# Clone the repository
git clone https://github.com/privacyshield-ai/privacy-firewall.git
  1. 打开 Chrome → 扩展程序 → 启用 开发者模式
  2. 点击 加载已解压的扩展程序,选择 privacy-firewall/src/extension
  3. (可选)运行 FastAPI 代理:
    cd privacy-firewall
    python -m uvicorn agent:app --host 127.0.0.1 --port 8765
  4. 打开 ChatGPT(或任何 AI 工具),粘贴敏感内容,观察警告/拦截。

完整说明请参见仓库的 README。

技术栈

  • Chrome Manifest V3(content scripts + background worker)
  • 本地代理使用 FastAPI
  • Hugging Face Transformers(dslim/bert-base-NER)实现本地 NER
  • 正则引擎实现确定性检测

当前重点 / 路线图

  • 弹出窗口中的 UI 设置面板
  • 自定义检测规则
  • 支持 Slack、Jira、Notion AI
  • Firefox 支持
  • 量化模型以加速推理并减小体积
  • 将代理打包成小型桌面应用(Windows/macOS/Linux)
  • 更好的脱敏而非直接拦截

FAQ 与社区

  • 这会拖慢我的打字速度吗?
    不会。Lite 模式完全在浏览器中运行,几乎没有开销;Advanced 模式只会增加本地 CPU 推理的少量负担。

  • 我可以白名单某些模式吗?
    可以。即将推出的 UI 将允许你添加自定义允许列表。

  • 它能与 Claude、Gemini 或其他 AI 工具一起使用吗?
    该扩展监控任何网页的粘贴事件,所以可以与任何 AI Web UI 配合使用。

我们期待以下群体的反馈:

  • 安全工程师
  • AI 安全从业者
  • Chrome 扩展开发者
  • 任何曾不小心把敏感数据粘贴到 AI 工具中的人 👀

立即尝试 🚀

  • ⭐ 为仓库加星
  • Issues 区块留下你的反馈
  • 如果有想法或改进,欢迎贡献代码

你是否曾不小心把敏感信息粘贴到 AI 工具中?感谢阅读——希望能让 AI 使用更安全。

Back to Blog

相关文章

阅读更多 »

心灵之眼织物

阶段 1 — C++ Sovereign Kernel Skeleton Daemon 首要目标 – 发布一个可运行的 C++ daemon,使其能够: - 接收事件 - 维护 capability graph 的 endpoints + edges。

AWS 开发者指南

为什么即使 Azure 和 GCP 等大玩家快速增长,AWS 仍然统治云计算,因为:- 最完整的生态系统 Compute、Storage、Database……