인스타그램이 스팸 댓글을 없앨 수 없는 이유
Source: Dev.to
인스타그램에서 인기 계정의 댓글을 스크롤해 본 적이 있다면, 스팸 댓글이 의심스러운 링크, 가짜 경품 행사, 혹은 수상한 서비스를 홍보하는 것을 보았을 것입니다. 이런 댓글은 셀러브리티 계정(수백만 명의 팔로워 보유), 틈새 취미 페이지, 심지어 소규모 크리에이터까지 어디서든 나타납니다. 어디를 가든 스팸 댓글이 존재합니다. 그런데 왜 그럴까요? 인스타그램은 이를 처리할 자원이 충분함에도 불구하고 스팸 댓글은 계속 나타납니다.
인스타그램 내장 필터 작동 방식
인스타그램에는 댓글 필터가 있습니다. 설정 → 댓글 → 사용자 지정 키워드 로 이동해 차단하고 싶은 단어를 직접 추가할 수 있습니다.
작동 원리는 간단합니다: 등록한 키워드와 정확히 일치하는 댓글을 숨깁니다. 문제는 각 키워드를 하나씩 추가해야 하고, 스팸이 조금이라도 다르게 쓰이면 필터가 전혀 잡아내지 못한다는 점입니다. 정확한 키워드 매칭에 의존하는 것은 근본적인 구조적 한계를 가지고 있습니다.
스패머가 필터를 우회하는 방법
같은 단어를 다르게 쓰면 필터가 인식하지 못합니다. 스패머는 바로 이 점을 이용합니다.
예시 변형
| 원본 | 변형 |
|---|---|
free gift | fr3e g1ft |
click here | c.l.i.c.k h.e.r.e |
discount | d¡scount |
주요 기법
- 문자 치환 – 문자 대신 숫자나 비슷하게 보이는 문자를 사용합니다.
free→fr3e. 사람에게는 동일하게 보이지만 필터에는 완전히 다른 문자열로 인식됩니다. - 공백/구두점 삽입 – 문자 사이에 공백이나 점을 넣습니다.
click here→c.l.i.c.k h.e.r.e. 인간은 여전히 읽을 수 있지만 필터는 다른 단어로 인식합니다. - 보이지 않는 문자 – 단어 중간에 제로‑폭 유니코드 문자를 삽입합니다. 눈에는 보이지 않지만 문자열 매칭을 완전히 깨뜨립니다.
free gift 를 차단하면 스패머는 곧바로 fr3e g1ft 로 바꿉니다. 그것을 또 차단하면 또 다른 변형을 찾아냅니다. 끝없는 두더지 잡기와 같습니다.
아직 해결되지 않은 이유
CommentGuard, NapoleonCat 등 댓글 관리 서비스가 존재하지만, 대부분은 같은 키워드 매칭 방식을 사용하고 UI만 더 깔끔하게 제공할 뿐입니다.
영어 스팸의 경우 변형이 비교적 단순하기 때문에 키워드 매칭이 어느 정도 효과적입니다. 그러나 한국어와 같은 언어에서는 스패머가 훨씬 정교한 회피 기법을 사용합니다—문자를 구성 요소(자음·모음)로 나누거나, 단어 사이에 공백을 삽입하거나, 유니코드 트릭을 활용하는 식입니다.
글로벌 서비스는 이러한 언어‑특화 패턴을 다룰 동기가 부족합니다. 그 결과 월 $29–79+ 수준의 도구가 여전히 비영어 스팸을 효과적으로 잡지 못합니다.
그래서 직접 만들었습니다
댓글 섹션에 스팸이 넘치는 모습을 보는 것이 지겨워졌습니다.
핵심 아이디어는 간단합니다: 텍스트를 그대로 비교하는 대신 먼저 정규화합니다. 스패머가 어떤 식으로 단어를 변형하든—문자 치환, 공백 삽입, 유니코드 트릭—정규화 과정을 거치면 원래 형태로 되돌아가 비교가 가능해집니다.
이렇게 vybbi.io 가 탄생했습니다—유튜브와 인스타그램 댓글을 위한 자동 스팸 탐지 및 제거 서비스입니다.
현재는 스팸 탐지에 집중하고 있지만, 향후 AI를 활용해 부정적·혐오 댓글까지 잡을 계획입니다.
추후 진행 상황을 곧 공유하겠습니다. 읽어 주셔서 감사합니다!