我在网上发现了我的博客文章的副本——这是我构建的用于追踪每个抄袭版本的工具
Source: Dev.to
你是否曾经在谷歌上搜索自己文章中的一段文字…
…结果发现 5 个其他网站把它当成自己的内容?
这事儿我也遇到过,而且不止一次。面对 DMCA 请求、无人回复的邮件以及只能给出“分数”却没有实际证据的抄袭检测工具,我决定自己动手做点东西。
今天,我把自己每天都在使用的工具分享出来——它可以 在整个网络上查找重复内容,并精准定位谁抄了什么。
为什么我会构建它
我需要三件现有工具没有提供的功能:
- 真实来源 —— 而不是模糊的百分比
- 可视化差异 —— 逐句相似度对比
- 证据 —— 可以直接发给托管服务商或编辑
而且我希望它能即时完成:粘贴文本 → 获得证据。于是 Nooth.dev 诞生了。
工作原理(演示)
你只需粘贴任意内容——博客文章、新闻通讯、文档、产品描述——Nooth.dev 会在网络上搜索匹配项。几秒钟内,你会得到:
- 包含相似或相同内容的网站列表
- 相似度分数
- 分屏对比视图(左侧 = 你的原文,右侧 = 找到的来源)
- 高亮的重叠部分,方便查看被复制的片段
- 域名元数据(年龄、权威性、地区)
你可以在这里试用(每天 3 次免费分析):
👉 nooth.dev – 无需登录。
真实案例:74% 相似度匹配
几天前,我测试了自己早期的一篇教程。Nooth 发现一个网站几乎原封不动地转载了它,相似度高达 74%。对比视图清晰显示了逐块复制的过程。那一刻,我意识到:好,这东西真的有用。
与众不同之处
大多数抄袭检测工具只能给你:
- ❌ 没有真实来源
- ❌ 没有详细对比
- ❌ 没有透明度
- ❌ 没有可用的证据
Nooth 更像是一个 取证工具:
- 它不会只说“复制了 67%”
- 它会显示 到底是哪句话 被复制
- 并且 来源于哪个站点

如果你在网上发布任何内容——尤其是技术类内容——这可以帮助你追踪作品的去向。

免费层(当前 MVP 阶段)
目前,早期访问期间:
- 每天 3 次免费分析(基于 IP,无需登录)
- 首批结果全部可见
- 其余匹配项将在即将上线的注册功能后解锁
所有功能均已完整实现,只是为了防止滥用而做了次数限制。注册 + 无限模式即将推出。
想要测试吗?
在这里试用在线工具:https://nooth.dev
如果你发现有趣的匹配,欢迎告诉我——可以在 X 私信我或留下评论。
接下来计划
在接下来的几周,我计划加入:
- 用户账户
- 保存报告功能
- 新复制出现时的邮件提醒
- 自动生成 DMCA 模板
- API 接口
我会在 Dev.to 上每周更新进展。