Show HN: 使用客户端工具调用的 AI 填写 PDF 表单
发布: (2026年5月2日 GMT+8 16:54)
3 分钟阅读
原文: Hacker News
Source: Hacker News
简介
我构建了 SimplePDF Copilot,一个可以与 PDF 编辑器交互的 AI 助手。它可以填写字段、回答问题、聚焦特定字段、添加字段、删除页面等。
隐私模型
- PDF 永不离开浏览器;解析、渲染和字段检测全部在客户端运行。
- 模型所需的文本(以及你的消息)仅发送给你选择的 LLM。默认使用我们的演示代理(DeepSeek V4 Flash,限速),但你可以 自带密钥 (BYOK) 并指向任何云提供商,或完全本地运行(例如使用 LM Studio)。
这种方式对文档隐私至关重要的医疗客户尤为重要,能够在不将个人身份信息(PII)发送给第三方的情况下提供 AI 体验。
功能
- 填写已有的表单字段。
- 添加新字段(在客户端使用 CommonForms(Joe Barrow1)检测并通过额外的后处理启发式算法完成)。
- 聚焦特定字段。
- 删除页面。
- 通过 PDF 编辑器支持的其他操作。
技术栈
- Tanstack Start
- 来自 Vercel 的 AI SDK
- Tailwind CSS(项目使用 Tailwind 进行样式设计;CSS 模块也是可选方案)
客户端工具调用
工具调用 是指 LLM 执行操作(例如运行
grep、ls或调用 API)的方式。
客户端工具调用 意味着 LLM 的调用意图在浏览器中接收,实际执行在本地完成。
好处
- 更快,因为操作保持在客户端之间。
- 对数据暴露有更大控制:你可以限制或完全移除向 LLM 提供文档内容的工具。
在演示中,文档内容会被送入 LLM,但只需移除该工具即可切断此连接。
演示与源码
注意: SimplePDF 本身(以 iframe 形式加载)并非开源。
欢迎随时提问!