从文本清理器到完整工具包:构建30+免费浏览器工具
Source: Dev.to

几个月前,我需要把 PDF 中的一段凌乱文字清理干净。市面上的在线工具要么广告满天飞,要么要求注册,甚至想把我的数据发送到他们的服务器。
于是我自己写了一个。随后我继续开发。
最初只是一个简单的文字清理工具,后来演变成 CleanUpTxt:一个包含 30 多个免费浏览器工具的套件,涵盖文本处理、图像 OCR、代码转换以及创意生成器。所有功能都在客户端运行,数据永不离开浏览器。
下面说说它是怎么诞生的,以及我一路上学到的经验。
技术栈
- React + TypeScript
- Tailwind CSS
- Tesseract.js(全客户端 OCR)
- 部署在 Vercel
首要目标是速度。大多数工具加载几乎是瞬间的,并且缓存后可以离线使用。没有后端意味着没有数据隐私问题——你的文字和图片永远不会触及服务器。
套件内容
文本清理
- 删除换行、重复行、空行、HTML 标签、逗号
- 去除多余空格
文本格式化
- 大小写转换、查找&替换、行排序、添加前缀/后缀、slugify、使 CSV 安全
- Bionic Reading 转换
转换工具
- 带实时预览的 Markdown 编辑器
- HTML 转义/反转义
- Base64 编码/解码
- URL 编码/解码
- JSON → TOON 格式化
- Lorem Ipsum 生成器
分析
- 单词计数、字符计数、可读性检查
- 文本差异比较
- 邮箱/数据提取器,用于从混乱文本中抽取结构化信息
图像转文字(OCR)
完全在浏览器中使用 Tesseract.js 运行。上传截图或照片,即可得到可编辑的文字——无需上传到服务器。
创意生成器
- 花式文字生成器、Discord 字体、手写体、故障文字、Zalgo 文字、隐形字符
这些可以帮助你为社交简介、用户名和消息创建个性化的文字。
实际流量最高的功能
花式文字生成器 和 Discord 字体 最受欢迎。人们想要为 Instagram 简介、Discord 用户名以及 Twitter 个人资料生成炫酷文字。OCR 也有大量使用,尤其是学生从课堂幻灯片和截图中提取文字。
开发者工具(Base64、JSON、Markdown)流量稳定,但竞争更激烈。
经验教训: 构建人们正在主动搜索的问题,而不是仅仅看起来技术炫酷的功能。
那些枯燥的中间阶段
第一周充满刺激——快速上线,肾上腺素飙升。随后就是磨砺:SEO 调整、边缘案例修复、移动端适配、为 30 多个页面编写 meta 描述。
我把副项目当作两轮交替的任务。当一个项目变得乏味时,就切换到另一个,保持动力而不在重复性工作上燃尽。
最终能成功的项目,往往是你坚持不放弃的那些。
隐私即功能
每个工具都在客户端处理数据。你的文字、你的图片——从不触及服务器。
这不仅是伦理选择;也是更易实现、更省成本,而且用户真的在意。“无需注册、无数据收集”比想象中更能打动人。
接下来计划
- 更多生成器(ASCII 艺术、其他 Unicode 样式)
- 改善移动端体验
- 可能推出 API,供开发者集成这些工具
试一试
所有功能均免费,访问 CleanUpTxt.com。无需注册,无使用限制。
如果你有想要的工具,欢迎在评论区告诉我。一直在寻找下一个要构建的点子。