Show HN: 使用客户端工具调用的 AI 填写 PDF 表单

发布: (2026年5月2日 GMT+8 16:54)
3 分钟阅读

Source: Hacker News

简介

我构建了 SimplePDF Copilot,一个可以与 PDF 编辑器交互的 AI 助手。它可以填写字段、回答问题、聚焦特定字段、添加字段、删除页面等。

隐私模型

  • PDF 永不离开浏览器;解析、渲染和字段检测全部在客户端运行。
  • 模型所需的文本(以及你的消息)仅发送给你选择的 LLM。默认使用我们的演示代理(DeepSeek V4 Flash,限速),但你可以 自带密钥 (BYOK) 并指向任何云提供商,或完全本地运行(例如使用 LM Studio)。

这种方式对文档隐私至关重要的医疗客户尤为重要,能够在不将个人身份信息(PII)发送给第三方的情况下提供 AI 体验。

功能

  • 填写已有的表单字段。
  • 添加新字段(在客户端使用 CommonForms(Joe Barrow1)检测并通过额外的后处理启发式算法完成)。
  • 聚焦特定字段。
  • 删除页面。
  • 通过 PDF 编辑器支持的其他操作。

技术栈

  • Tanstack Start
  • 来自 Vercel 的 AI SDK
  • Tailwind CSS(项目使用 Tailwind 进行样式设计;CSS 模块也是可选方案)

客户端工具调用

工具调用 是指 LLM 执行操作(例如运行 grepls 或调用 API)的方式。
客户端工具调用 意味着 LLM 的调用意图在浏览器中接收,实际执行在本地完成。

好处

  • 更快,因为操作保持在客户端之间。
  • 对数据暴露有更大控制:你可以限制或完全移除向 LLM 提供文档内容的工具。

在演示中,文档内容会被送入 LLM,但只需移除该工具即可切断此连接。

演示与源码

  • 演示是完全开源的,代码托管在 GitHub 上2
  • 在线演示与本文链接相同3

注意: SimplePDF 本身(以 iframe 形式加载)并非开源。

欢迎随时提问!

Footnotes

  1. https://github.com/jbarrow/commonforms

  2. https://github.com/SimplePDF/simplepdf-embed/tree/main/copil

  3. https://copilot.simplepdf.com/?share=a7d00ad073c75a75d493228

0 浏览
Back to Blog

相关文章

阅读更多 »

当网络无法工作时

我的 Windows 11 → Tyan SMDC IPMI 故障排除故事 _上周,我花了太多时间尝试让我的 Windows 11 机器与一台古老的 Tyan SMDC S...