为什么我自己构建了 Humanizer（以及你也应该这么做的原因）

发布: 3天前 (2026年2月25日 GMT+8 01:19)

5 分钟阅读

Source: Dev.to

为《我为何自己构建 Humanizer（以及你也该这么做）》的封面图片

原始 Humanizer

有一个叫 humanizer 的工具，是 blader 基于 Claude Code 技能构建的，灵感来源于维基百科的 AI 写作检测指南。它拥有 4,100 颗星，数百个 fork，且社区活跃，持续添加模式和语言支持。如果你想从任何文本中剔除 AI 迹象，它做得很好。

Humanizer 会将你的写作与通用的人类基准进行比较。它了解 AI 写作的特征，并标记诸如重要性夸大、避免系动词、三段式规则、破折号过度使用等模式——共 24 条，来源于维基百科的 AI 清理指南。将草稿跑一遍，找出这些迹象，然后重写。

如果你的目标是让文本看起来不像是 AI 生成的，这个方法就有效。

我的目标是写出 听起来像我自己的 文本。这两者相关但并不相同。我可以写出一篇通过所有 Humanizer 检查的草稿，却完全不像我已发表的作品——没有 AI 迹象，但也没有个人声音。缺乏声音的死板文字和垃圾文本一样容易被识别，只是被不同的读者识别。

我需要的不是一份需要避免的模式列表，而是针对我自己最佳写作的校准。

我在 blader 的工具基础上构建了 voice‑humanizer，保留了原来的 24 条模式，并从一次社区 PR 中加入了三条新模式。关键的新增是一个 CORPUS.md 文件，里面放入你自己的已发表作品。该技能会在检查其他内容之前，从语料库中提取 声音指纹。

工作流程现在是：

当它标记出问题时，不仅会说“这个模式看起来像 AI”。它会举例说明，例如：“这段文字像 Claude，因为它使用了三个平行项，而你的语料库显示你倾向于压缩为两个。下面是你可能会改写的方式。”这样提供更具可操作性的反馈。

因为指纹记录了你倾向使用和避免的写作方式，工具能够区分看似 AI 迹象但实际上是你个人风格的选择。

示例：我的写作会有意使用破折号——每篇文章一次，作为结构性标记。通用 Humanizer 会把它标记为问题，但 Voice‑Humanizer 不会，因为该模式出现在我的语料库中。同理，任何其他会导致误报的个人写作习惯也会被正确识别。

你可以自行尝试。仓库是公开的：

CORPUS.md 已被 git 忽略，所以你的写作保持私密。CORPUS.example.md 展示了预期的格式，SETUP.md 包含了五个问题，帮助你在开始之前提取自己的声音指纹。

注意：没有语料库，Voice‑Humanizer 无法工作。这是有意为之——没有个人基准，工具就无法针对你的声音进行校准。

感谢 blader 提供的原始基础——模式列表和技能格式。Voice‑Humanizer 为特定类型的写作者解决了更细化的问题：那些已经写出足够多作品，知道自己最佳作品的声音是什么，并且不希望 AI 辅助把它们压平的人。