두 개발자와 코파일럿이 만든 ClassifierAI, DEV에서 AI 생성 콘텐츠를 자동 감지하는 크롬 확장 프로토타입
출처: Dev.to
이 글은 GitHub Finish‑Up‑A‑Thon 챌린지 제출물입니다.
참고: AI는 현재 개발자 커뮤니티에서 뜨거운 주제입니다. 댓글을 달기 전에 이 글을 전체적으로 읽어보시길 권합니다. 사용된 데이터셋은 dev.to에서 온 것이 아니므로 AI 모델이 부정확할 수 있습니다. 이는 앞으로 다른 사람들에게 도움이 될 수 있는 도구를 보여주고, 추후 DEV 플랫폼에 맞게 정확도를 높이기 위한 시연입니다. 추후 글에서 더 자세히 설명하겠습니다. 질문이나 의견이 있으면 언제든 알려 주세요!
저자
주 저자: Francis Tran @francistrdev
공동 저자: Elmar Chavez @codingwithjiro
이것은 Francis와 Elmar가 함께 만든 팀 제출물입니다!
목차
소개
AI는 인터넷 전반을 뒤흔들었습니다. 정보에 더 빠르고 쉽게 접근할 수 있게 된 것부터 개발 워크플로에 AI가 녹아들기까지 그 범위는 방대합니다.
AI 사용의 장점과 함께 어두운 면도 존재합니다. 현재 많은 사이트가 구글 검색 순위를 올리기 위해 순수 AI가 만든 콘텐츠를 대량 생산하고 있어 불필요한 경쟁을 초래하고 있습니다. 또한 AI가 고도화되면서 인간이 만든 콘텐츠와 AI가 만든 콘텐츠를 구분하기가 점점 어려워지고 있습니다. “AI”라는 이름 자체가 도구로서 사용 여부와 관계없이 부정적인 인식을 낳고 있습니다.
AI가 어디에나 퍼져 있지만, 이를 막으려는 사람들도 많습니다. 일부는 전문적인 환경에서, 또 일부는 (전혀 권장되지 않는) 자경단식으로 대응합니다. DEV 사용자로서 우리의 목표는 dev.to에 AI가 만든 글이 최소화되도록 하여 사용자 경험을 향상하고, 개발자들이 배우고 성장할 수 있는 다양한 콘텐츠를 제공하는 것입니다.
그 목표 아래, Elmar와 협업해 ClassifierAI를 만들었습니다!
면책조항: 댓글을 달기 전에, 이 프로젝트는 프로토타입임을 알려드립니다! 기존 데이터에 기반해 Chrome 확장 프로그램이 할 수 있는 일을 보여주기 위한 시연이며, 데이터가 dev.to에서 직접 온 것이 아니기 때문에 모델이 정확하지 않을 수 있습니다. 이 Chrome 확장 프로그램은 dev.to 외부 데이터 때문에 AI‑Generated 콘텐츠를 완벽히 걸러내는 솔루션이 아닙니다. 추후 글에서 이 부분을 더 자세히 다루겠습니다.
우리가 만든 것
우리는 ClassifierAI라는 프로토타입 Chrome 확장 프로그램을 만들었습니다. 이 확장 프로그램은 DEV에서 AI가 만든 콘텐츠를 즉시 감지할 수 있게 해줍니다. 구현에는 Tensorflow.js를 사용했습니다.
이미지 분류 – Google의 Teachable Machine을 이용해 기사 표지 이미지가 AI가 만든 것인지 판단합니다.
사용된 데이터셋: https://huggingface.co/datasets/Hemg/AI-Generated-vs-Real-Images-Datasets
총 866장의 이미지(클래스당 433장, “AI”와 “NotAI” 두 클래스)로 학습한 설정:
866 Images Total
2 Classes Total
- "AI" Class
- "NotAI" Class
Epochs: 30
Batch Size: 16
Learning Rate: 0.0001
텍스트 분류 – 기사 자체가 AI가 만든 것인지 판단합니다.
사용된 데이터셋: https://huggingface.co/datasets/gouwsxander/wikipedia-human-ai
처음에는 Google 이미지에서 100장의 이미지를 스캔해 AI 생성 여부를 판단하고 라벨링하는 Chrome 확장 프로그램으로 시작했습니다.
이후 dev.to 전용으로 확장 프로그램을 업데이트하여, 표지 이미지와 본문 전체를 분석하고 결과를 사용자에게 표시합니다. 사용자가 DEV에서 글을 클릭할 때마다 자동으로 작동합니다.
이 프로젝트가 존재하는 이유
생성형 AI는 현재 제 주변에서 뜨거운 이슈입니다. 많은 친구와 동료들이 **“일자리를 대체한다”**는 생각 때문에 생성형 AI를 혐오합니다.
익숙하시죠? 최소 한 번은 들어보셨을 겁니다…
GPTZero 같은 도구가 존재하지만 여전히 문제는 남아 있습니다.
- 수작업이 많다 – 복사·붙여넣기만으로 AI 여부를 확인해야 함.
GPTZero를 우회해 “Human” 결과를 얻는 도구도 있습니다. 커뮤니티마다 글쓰기 스타일이 달라 AI 생성 콘텐츠를 장기적으로 식별하기가 어렵습니다.
이러한 문제와 DEV 현황을 고려해, GPTZero를 열고 복사·붙여넣기까지 할 필요 없이 자동으로 AI 생성 콘텐츠를 식별해 주는 유용한 도구를 만들고 싶었습니다.
또한, 이 Chrome 확장 프로그램은 DEV에 특화되었습니다. 앞으로 수집될 데이터셋이 DEV에 맞춰 더 집중되고 정확해질 것이라 믿기 때문입니다 (블로그 플랫폼마다 글쓰기 스타일이 다르므로 DEV에 맞춘 것이 더 효과적이라 판단했습니다).
결국, 이 확장 프로그램은 수작업을 줄이고 DEV에 맞춤화된 솔루션을 제공함으로써, 범용적인 AI 스캐너를 우회하는 도구들의 효과를 감소시킵니다.
커뮤니티의 지원이 있다면 모델이 더욱 정교해지고 정확해질 것이라 기대합니다! 그래서 우리는 비공식 DEV Chrome 확장 프로그램으로 오픈소스화했습니다. 자세한 내용은 글 뒤에서 다룹니다.
그럼 이제 프로토타입 Chrome 확장 프로그램이 실제로 어떻게 동작하는지 보여드리겠습니다!
데모
이 데모에서는 우리는 … (본문이 여기서 끊겼습니다)



