为什么 Instagram 无法根除垃圾评论
Source: Dev.to
如果你曾在热门账号的 Instagram 评论区滚动浏览,你大概已经看到过宣传可疑链接、假赠品或可疑服务的垃圾评论。它们无处不在——拥有数百万粉丝的名人账号、细分兴趣页面,甚至是小创作者的账号。无论你去哪里,垃圾评论都会出现。那为什么会这样呢?Instagram 显然有资源来处理这些问题,但垃圾评论仍然层出不穷。
Instagram 内置过滤器的工作原理
Instagram 确实有评论过滤功能。你可以进入 设置 → 评论 → 自定义关键词,手动添加想要屏蔽的词。
其机制相当直接:隐藏完全匹配你注册的关键词的评论。问题在于,你必须一次一个地添加关键词,而且如果垃圾信息的写法稍有不同,过滤器就会完全漏掉。依赖精确关键词匹配本身就存在根本性的结构性限制。
垃圾发布者如何击败过滤器
如果你把同一个词写得不一样,过滤器就识别不了。垃圾发布者正是利用这一点。
示例变体
| 原始 | 变体 |
|---|---|
free gift | fr3e g1ft |
click here | c.l.i.c.k h.e.r.e |
discount | d¡scount |
主要技术手段
- 字符替换 – 用数字或相似字符替代字母。
free→fr3e。对人类来说仍然可读,但对过滤器而言是完全不同的字符串。 - 空格/标点插入 – 在字符之间加入空格或点。
click here→c.l.i.c.k h.e.r.e。人类仍能读懂,但过滤器看到的是不同的词。 - 不可见字符 – 在单词中间插入零宽度 Unicode 字符。这些字符肉眼不可见,却会彻底破坏字符串匹配。
当你屏蔽 free gift 时,垃圾发布者只会改用 fr3e g1ft。再把它屏蔽,他们又会换另一种变体。这是一场无止境的打地鼠游戏。
为什么没有人彻底解决这个问题
市面上有一些评论管理服务——CommentGuard、NapoleonCat 等——但大多数仍然采用相同的关键词匹配方式,只是提供了更友好的 UI。
对于英文垃圾评论,关键词匹配还能勉强起作用,因为变体相对简单。然而,对于韩语等语言,垃圾发布者会使用更高级的规避技巧——将字符拆分为组成的子音和元音,在词内部插入空格,甚至使用 Unicode 小技巧。
全球化的服务对这些语言特定的模式缺乏足够的动力。结果是?即使是每月 $29–79+ 的工具,也仍然难以有效拦截非英文垃圾评论。
所以我自己动手做了一个
我已经厌倦了看到垃圾评论淹没评论区。
核心思路很简单:不是直接比较原始文本,而是先对其进行规范化。无论垃圾发布者如何伪装——字符替换、空格插入、Unicode 小技巧——规范化都会把它们还原为原始形式,从而让比较能够捕捉到。
于是 vybbi.io 诞生了——一个针对 YouTube 和 Instagram 评论的自动化垃圾检测与清除服务。
目前它主要聚焦于垃圾检测,未来计划使用 AI 进一步捕捉负面和仇恨评论。
更多旅程细节即将上线。感谢阅读!