为什么 Instagram 无法根除垃圾评论

发布: (2026年3月18日 GMT+8 01:46)
5 分钟阅读
原文: Dev.to

Source: Dev.to

如果你曾在热门账号的 Instagram 评论区滚动浏览,你大概已经看到过宣传可疑链接、假赠品或可疑服务的垃圾评论。它们无处不在——拥有数百万粉丝的名人账号、细分兴趣页面,甚至是小创作者的账号。无论你去哪里,垃圾评论都会出现。那为什么会这样呢?Instagram 显然有资源来处理这些问题,但垃圾评论仍然层出不穷。

Instagram 内置过滤器的工作原理

Instagram 确实有评论过滤功能。你可以进入 设置 → 评论 → 自定义关键词,手动添加想要屏蔽的词。

其机制相当直接:隐藏完全匹配你注册的关键词的评论。问题在于,你必须一次一个地添加关键词,而且如果垃圾信息的写法稍有不同,过滤器就会完全漏掉。依赖精确关键词匹配本身就存在根本性的结构性限制。

垃圾发布者如何击败过滤器

如果你把同一个词写得不一样,过滤器就识别不了。垃圾发布者正是利用这一点。

示例变体

原始变体
free giftfr3e g1ft
click herec.l.i.c.k h.e.r.e
discountd¡scount

主要技术手段

  • 字符替换 – 用数字或相似字符替代字母。freefr3e。对人类来说仍然可读,但对过滤器而言是完全不同的字符串。
  • 空格/标点插入 – 在字符之间加入空格或点。click herec.l.i.c.k h.e.r.e。人类仍能读懂,但过滤器看到的是不同的词。
  • 不可见字符 – 在单词中间插入零宽度 Unicode 字符。这些字符肉眼不可见,却会彻底破坏字符串匹配。

当你屏蔽 free gift 时,垃圾发布者只会改用 fr3e g1ft。再把它屏蔽,他们又会换另一种变体。这是一场无止境的打地鼠游戏。

为什么没有人彻底解决这个问题

市面上有一些评论管理服务——CommentGuardNapoleonCat 等——但大多数仍然采用相同的关键词匹配方式,只是提供了更友好的 UI。

对于英文垃圾评论,关键词匹配还能勉强起作用,因为变体相对简单。然而,对于韩语等语言,垃圾发布者会使用更高级的规避技巧——将字符拆分为组成的子音和元音,在词内部插入空格,甚至使用 Unicode 小技巧。

全球化的服务对这些语言特定的模式缺乏足够的动力。结果是?即使是每月 $29–79+ 的工具,也仍然难以有效拦截非英文垃圾评论。

所以我自己动手做了一个

我已经厌倦了看到垃圾评论淹没评论区。

核心思路很简单:不是直接比较原始文本,而是先对其进行规范化。无论垃圾发布者如何伪装——字符替换、空格插入、Unicode 小技巧——规范化都会把它们还原为原始形式,从而让比较能够捕捉到。

于是 vybbi.io 诞生了——一个针对 YouTube 和 Instagram 评论的自动化垃圾检测与清除服务。

目前它主要聚焦于垃圾检测,未来计划使用 AI 进一步捕捉负面和仇恨评论。

更多旅程细节即将上线。感谢阅读!

0 浏览
Back to Blog

相关文章

阅读更多 »