Google이 내 10만 페이지 사이트의 2%만 색인했습니다. 이에 대한 내 대응 방안
Source: Dev.to
위 링크에 있는 글의 전체 내용을 제공해 주시면, 해당 텍스트를 한국어로 번역해 드리겠습니다. (코드 블록, URL 및 마크다운 형식은 그대로 유지됩니다.)
문제
현재 GSC 색인 보고서
| 상태 | 페이지 | 의미 |
|---|---|---|
| Crawled — not indexed | 51,061 | Google이 페이지를 방문하고 읽었지만 “아니요”라고 답함. |
| Discovered — not indexed | 28,016 | Google은 URL이 존재한다는 것을 알지만 크롤링조차 하지 않음. |
| Indexed | 1,920 | 선택된 2 %만 색인됨. |
| Redirects | 2,648 | 내가 의도적으로 제거한 페이지. |
가장 고통스러운 라인은 “Crawled — not indexed.” 입니다. Googlebot이 51 k 페이지에 크롤링 예산을 소모하고, 이를 처리한 뒤 색인할 가치가 없다고 판단하고 있습니다. 이는 발견 문제가 아니라 품질 문제입니다.
더 심각한 점은 색인된 페이지 수가 2,246개에서 1,920개로 일주일 만에 감소했다는 것입니다. Google이 이전에 허용했던 페이지들을 적극적으로 색인에서 제외하고 있습니다.
Source: …
내가 확인한 근본 원인
Thin‑Content Signals
- 원본 페이지: 템플릿화된 분석 200‑300 단어.
- 새 도메인에선 고유 가치를 입증하기에 충분하지 않음.
- AI‑first indexing은 얕고 구조가 비슷한 수천 개 페이지를 저품질로 간주함.
- 내가 한 일: 페이지를 600‑800 단어로 확장하여 더 깊은, 티커‑특화 분석을 추가함. 평판 손상은 시간이 지나야 회복될 수 있음.
Zero Domain Authority
- 확인한 모든 도구에서 백링크가 없음.
- 레퍼런스 감사에서는 8 M개의 발견된 페이지 중 650 k만이 인덱싱된 사이트를 발견했으며, 원인은 신뢰 신호 부족이었음.
- 내가 하고 있는 일: Medium, Dev.to, Hashnode에 다섯 개의 글을 게시했으며(여전히 바다 한 점), 자연스럽게 백링크가 걸릴 더 많은 글을 계획 중임.
Crawl‑Budget Economics
- Google은 인식된 중요도에 따라 크롤링 예산을 할당함.
- 신뢰하지 않는 도메인에 100 k+ URL이 있으면 대부분의 예산이 절대 인덱싱되지 않을 페이지에 낭비됨.
- 이는 악순환을 초래함: 권한 낮음 → 크롤링 감소 → 인덱싱된 페이지 감소 → 트래픽 감소 → 여전히 권한 낮음.
프로그램적 SEO 플레이북 전환
1. 빼고, 그 다음 더하기
- 모든 비교 페이지(가장 얇은 콘텐츠)를 제거했습니다.
- GSC에 있는 2,648개의 리디렉션이 삭제를 증명합니다.
- 원칙: 적은 수, 더 좋은 페이지 > 많은 페이지.
2. 모든 종목 페이지 강화
- 자동 생성할 수 없는 고유 섹션을 추가했습니다:
- 관련 뉴스
- 애널리스트 평점
- 실적 일정
- 시장 맥락 코멘터리
- 목표: 각 페이지가 단순히 데이터 표에 문단을 얹은 것이 아니라 정당한 분석임을 구글의 품질 분류기에 설득하는 것입니다.
3. 내부 링크 강화
- 위젯 구축: “관련 종목,” “이 섹터에서 인기.”
- 종목 페이지, 섹터 페이지, ETF 페이지를 교차 연결합니다.
- 구글이 주제 관계를 이해하도록 돕고 도메인의 권한을 퍼뜨립니다.
4. 외부 권위 구축
- 5개의 기사가 세 플랫폼에 게재되어 각각 StockVS로 연결됩니다.
- 향후 콘텐츠는 대규모 사이트 구축 여정에 초점을 맞춰 개발자와 SEO 담당자에게 공감대를 형성합니다.
- 이 기사 자체도 그 전략의 일환입니다.
5. 다국어 차익 활용
- GSC 데이터에 따르면 비영어 페이지가 영어 페이지보다 더 많은 노출을 얻습니다.
- 네덜란드어 페이지가 선두이며, 그 다음이 독일어와 폴란드어입니다.
- “
[ticker] analyse”(네덜란드어) 경쟁이 “[ticker] analysis”(영어)보다 현저히 낮습니다. - 다국어 접근법이 경쟁이 덜한 SERP에서 승리할 수 있음을 검증합니다.
새로운 인덱싱 현실은 이렇게 보인다
- 콘텐츠 깊이 – 템플릿이 자동으로 생성할 수 있는 수준을 넘어선다.
- 권위 신호 – 백링크, 브랜드 검색, 참여 지표.
- 기술적 위생 – 깔끔한 사이트맵, 올바른 캐노니컬, 빠른 로드 시간, 크롤링 함정 없음.
- 인내 – 얇은 콘텐츠 신호에서 회복 중인 도메인의 구글 재평가 주기는 느리다.
내가 추적하는 주간 지표
| 지표 | 중요한 이유 |
|---|---|
| Crawled‑not‑indexed count | 콘텐츠 품질이 향상됨에 따라 감소해야 합니다. |
| Indexed page count | 핵심 지표입니다. |
| Impressions on non‑English pages | 다국어 차익거래 효과를 보여줍니다. |
| Domain Rating (Ahrefs) | 현재 0; 변동이 있으면 권위가 성장하고 있음을 나타냅니다. |
행동 요청
프로그래밍 SEO 사이트를 구축하고 동일한 색인 장벽에 부딪히고 있다면, 대화해요. “페이지만 더 만들면 된다”는 옛 전략은 사라졌습니다. 2026년 성공은 다음에 달려 있습니다:
- 깊이 – 각 페이지가 개별적으로 가치를 입증해야 합니다.
- 권위 – 백링크와 브랜드 신뢰를 확보하세요.
- 기술적 우수성 – 구글 크롤러를 만족시켜야 합니다.
- 인내 – 구글이 재평가할 시간을 주세요.
당신에게 효과적인 방법은 무엇인가요?
deserve to be indexed.
I write about building large‑scale SEO sites, AI‑powered content generation, and the tools I use to manage it all. If you're into programmatic SEO, check out my **Programmatic SEO Blueprint** — it covers the architecture, data pipelines, and multilingual strategy I use for StockVS.
For AI‑powered SEO workflows, I've also built a set of **Claude Skills** that handle everything from content auditing to cross‑platform publishing.