为什么我在构建免费 PDF 和图像工具,它们从不触及服务器

发布: (2026年5月9日 GMT+8 04:30)
7 分钟阅读
原文: Dev.to

Source: Dev.to

请提供您希望翻译的具体文本内容,我将为您翻译成简体中文并保留原始的格式、Markdown 语法以及技术术语。谢谢!

我们信任的“免费”在线工具的文档

想想过去一年里你上传到在线工具的文件:

  • 银行对账单(用于转换为 Excel 或 CSV)
  • 薪资单和税务文件(用于压缩或转换)
  • 护照和政府身份证扫描件(用于裁剪、调整大小或转换)
  • 电商产品照片(用于去除背景)
  • 客户合同和协议(用于合并或签署)
  • 医疗报告和处方(用于与医生共享)

在大多数流行工具中,这些文件都会传输到你无法控制的服务器。iLovePDF、Smallpdf 以及几乎所有你使用过的免费工具都是如此——你的文件会被上传到它们的云端,进行处理,然后“在短时间后删除”。这只是它们的话,并不构成保证。

对于普通文档,也许还能接受。但对于上述所有文件?这不应被视为可接受的做法。

2025 年浏览器的实际能力

现代浏览器不再仅仅是文档查看器。借助 WebAssembly、ONNX Runtime Web 和 GPU 加速,2025 年的浏览器标签页可以本地运行三年前云服务器才能运行的同样的 AI 模型和处理流水线——全部在你的设备上完成,无需网络请求

这意味着背景移除、PDF 处理、文档转换、图像编辑——所有这些都可以完全在浏览器内部完成。你的文件永远不会离开你的设备。因为我根本没有收到你的文件,所以我这边没有任何可以被攻击的对象。

这在架构上与那些承诺“文件在 1 小时后删除”的工具截然不同。我根本没有拿到文件,怎么可能删除呢。

我在构建的东西

pdfandimagetools.com 是一个基于浏览器的生产力平台。所有工具都在本地处理文件。无需上传。无需账号。无限制。无水印。

PDF 工具

  • 合并、拆分、压缩和转换文档
  • 将银行对账单转换为 Excel 或 CSV
  • 从扫描文档中提取文本

全部在您的设备上完成,您的文件绝不会触及服务器。

图像工具

  • 使用 BiRefNet(一款最先进的 MIT 许可证 AI 模型,完全在浏览器中运行)去除背景
  • 在图像格式之间相互转换
  • 压缩照片
  • 将背景替换为纯色、渐变或您自己的图片

身份证件工具

  • 按精确规格调整和裁剪护照照片
  • 将身份证扫描件转换为政府门户和签证申请所需的正确格式和文件大小

您的护照、国家身份证及其他证件均在本地处理,关闭标签页后即会消失。

诚实的权衡

浏览器端 AI 唯一真正的成本在于首次加载。BiRefNet 的轻量模型大约 150 MB —— 第一次使用时需要下载相当可观的文件。

我通过渐进式加载来处理这个问题。页面和 UI 会立即渲染,同时进度条在后台显示模型的加载过程。首次访问结束后,模型会直接保存到你的设备上——而不是任何服务器——因此之后的每次访问都能在两秒以内完成加载。它的工作方式类似于手机上的任何应用,能够在会话之间记住数据,但完全由你自行控制。

对于 PDF 工具来说,没有任何实质性的权衡。基于浏览器的 PDF 处理往往比云端工具更快,因为省去了上传和下载的往返过程。

The stack

  • Next.js 15
  • TypeScript
  • Tailwind CSS
  • Hugging Face Transformers.js
  • ONNX Runtime Web
  • pdf-lib
  • WebAssembly(推理在 Web Workers 中运行,UI 永不冻结)
  • WebGPU 加速(在支持的情况下)

为什么这很重要

每个目前会把你的文件上传到他人服务器的工具,都应该有一个免费、基于浏览器的替代方案,而不是这样做。这就是本项目的目标。

如果你曾经把敏感文档上传到这些工具之一,并且心想,“等等,它到底去了哪里?”——这正是为你而构建的。

网站即将在 pdfandimagetools.com 上线——请订阅通知,第一时间了解上线信息。

如果你想关注构建过程——技术决策、失误、进展——在 Dev.to 上关注我。我会撰写关于架构、挑战以及一路上学到的所有内容。

如果你在乎以隐私为先的工具,欢迎在下方评论区留下你的想法。

公开构建。无风险投资。无数据收集。隐私不打折。

0 浏览
Back to Blog

相关文章

阅读更多 »