Show HN: 178 AI 모델의 writing styles와 similarity clusters에 대한 지문을 남겼습니다

발행: 3주 전 (2026년 4월 8일 오후 11:06 GMT+9)

3 분 소요

원문: Hacker News

Source: Hacker News

Dataset

43개의 프롬프트에 걸친 3,095개의 표준화된 AI 응답.
각 응답은 32‑차원 스타일러믹 지문(어휘 풍부도, 문장 구조, 구두점 습관, 포맷팅 패턴, 담화 표지)으로 표현됩니다.

Findings

9개의 클론 클러스터 (> 90 % 코사인 유사도, z‑정규화된 특징 벡터 기준).
Mistral Large 2와 Large 3은 다섯 개의 독립 신호를 결합한 복합 지표에서 84.8 % 점수를 달성했습니다.
Gemini 2.5 Flash Lite는 Claude 3 Opus와 78 % 유사하게 작성하지만 비용은 185배 낮습니다.
Meta는 37.5배의 구별도 비율을 보이며 가장 강력한 제공자 “하우스 스타일”을 나타냅니다.
프롬프트 **“Satirical fake news”**는 모든 모델에서 가장 큰 글쓰기 수렴을 일으킵니다.
프롬프트 **“Count letters”**는 가장 큰 발산을 일으킵니다.

Composite Clone Score

복합 클론 점수는 다음을 결합합니다:

프롬프트 제어 하에 직접 비교되는 유사도.
과제 전반에 걸친 각 특징별 Pearson 상관관계.
응답 길이 상관관계.
프롬프트 간 일관성.
전체 코사인 유사도.

Technology

Node.js로 구현된 스타일러믹 추출.
특징 벡터에 Z‑점수 정규화 적용.
전체 비교에 코사인 유사도 사용.
각 특징 추적에 Pearson 상관관계 활용.
분석 스크립트는 약 1,400줄의 코드로 구성됩니다.

Additional Information

댓글 URL:
포인트: 24
댓글: 6

관련 글

AI 모델은 축구 베팅에 형편없다—특히 xAI Grok

“우리가 평가한 모든 프론티어 모델은 시즌 동안 손실을 보았으며, 많은 모델이 파산에 이르렀다,” 라고 논문 저자들은 결론지었다. AI가 “체계적으로 …”

토큰 낭비를 멈춰라: LLM 비용을 97% 절감하는 방법

AI 파이프라인에 숨겨진 비용 GPT나 Claude로 구축하고 있다면 아마도 다음과 같은 과정을 거쳤을 것입니다: 1. API 호출 2. 큰 JSON 응답 받기 3. 전체를 전송하기...

OverthinkAI — 나는 단 하나의 질문에도 답할 수 없는 AI를 만들었다

개요: 매번 내가 ChatGPT에 간단한 질문을 하면, 그것은 깔끔하고 직접적이며 자신감 있는 답변을 준다. 나는 이것이 매우 의심스럽다. 진정한 사고는 …

ChatGPT, Claude에 도전하기 위해 $100 Pro 구독 출시

OpenAI는 Anthropic의 Claude와 가격을 맞추는 $100짜리 새로운 Pro 구독을 출시했습니다.