나는 287,000페이지 웹사이트를 만들었다. 여기서 배운 Programmatic SEO.
Source: Dev.to
대부분의 SEO 조언은 같은 내용으로 귀결됩니다
- 키워드를 선택합니다.
- 글을 작성합니다.
- 3개월을 기다립니다.
- 반복합니다.
트래픽을 10× 원한다면, **10×**의 콘텐츠를 작성해야 합니다. 하지만 혼자서 팀을 운영할 때는 이 수식이 통하지 않습니다.
다른 접근법
약 1년 전, 나는 프로그래밍 방식 방법을 실험하기 시작했습니다:
- 글을 하나씩 쓰는 대신, 프로그래밍 방식으로 페이지를 생성하는 시스템을 구축했습니다.
- 하나의 템플릿 + 하나의 데이터 파이프라인 = 수천 개의 출력 페이지.
- 각 페이지는 특정 롱테일 키워드를 목표로 합니다.
노력은 기계를 구축하는 데 들어가며, 기계에 데이터를 공급하는 데는 들어가지 않습니다.
The project: a stock comparison engine
- Input – 두 개의 티커 심볼.
- Output – 나란히 비교: 재무, 배당금, 성장 지표 등.
- Scale – 12개 언어에 걸친 모든 의미 있는 주식 쌍.
Result: 287,000 페이지를 한 사람이 구축했습니다. 콘텐츠 팀은 없습니다.
실제로 일어난 일
기술 스택
| Component | Role |
|---|---|
| Astro | 정적 사이트 생성 – 빠르고 SEO‑친화적이며 수천 개의 라우트를 처리 |
| Supabase PostgreSQL | 데이터 레이어 |
| yfinance API | 금융 데이터 가져오기 |
| Local Llama 3 | 각 페이지에 대한 서술 섹션 생성 |
| Cloudflare CDN | 정적 파일 제공 |
월간 총 비용: $50 이하.
핵심 인사이트
데이터와 프레젠테이션을 분리한다.
- 데이터베이스는 8,000개 이상의 티커에 대한 구조화된 금융 데이터를 저장한다.
- 템플릿은 해당 데이터를 비교 페이지로 렌더링하는 방식을 정의한다.
- AI가 빈틈을 메워—각 쌍에 고유한 인간 친화적인 분석을 생성한다.
아키텍처 다이어그램
Data Layer (Supabase PostgreSQL)
↓
ETL Pipeline (Python + yfinance)
↓
Content Generation (Llama 3 – local)
↓
Static Site Generator (Astro)
↓
CDN (Cloudflare)각 레이어가 독립적이어서 교체(예: Astro → Next.js, Llama 3 → Claude)가 손쉽다.
롱테일 커버리지
- 모든 주식 쌍에 대한 페이지를 만들면 다른 사람이 타깃팅하지 않는 검색을 포착한다.
- 예시: “Random small‑cap vs other random small‑cap”은 거의 경쟁이 없다.
- 개별 페이지 트래픽은 작지만 287k 페이지 전체의 누적 트래픽은 상당히 크다.
다국어 지원
- 템플릿과 데이터 파이프라인이 준비되면 12개 언어로 번역하는 것은 주로 템플릿 문자열을 번역하고 페이지를 재생성하는 일이다.
- 숫자, 티커, 퍼센트는 그대로 유지된다.
- 초기 번역은 AI를 사용하고, 가장 중요한 페이지는 수작업으로 다듬었다.
대규모 스키마 마크업
- 모든 페이지에 FinancialProduct, FAQ, BreadcrumbList 스키마가 포함된다.
- 프로그래밍 방식이므로 스키마를 한 번만 작성하면 287k 페이지 모두에 적용된다—수동으로는 불가능한 작업이다.
안정성
- 빌드 파이프라인은 정적이며 구조화된 데이터에서 생성되므로 런타임에 문제가 발생할 가능성이 거의 없다.
- 사이트는 순수 HTML 파일만 제공—서버‑사이드 처리, 페이지 로드 시 DB 쿼리, 충돌 위험이 전혀 없다.
숨겨진 문제: Google이 새 도메인에서 287k 페이지를 색인하지 않음
- 색인된 페이지: 약 2,500개 (≈ 0.9 % 색인 비율).
- 근본 원인:
- 도메인 권한 부족 – 백링크가 전혀 없고 브랜드 인지도도 없음.
- 콘텐츠 유사성 – 서술 방식이 비슷해 Google의 “유용한 콘텐츠” 필터에 걸려 얇은 페이지로 판단됨.
- 크롤링 예산 – Googlebot이 하루에 200‑500 페이지만 방문했으며, 이 속도로는 모든 페이지를 크롤링하는 데 수년이 걸리고 Google은 가치가 낮다고 판단한 페이지를 크롤링하지 않음.
직관에 반하는 해결책: 더 많은 페이지가 아니라 적은 페이지
페이지를 과감히 축소
- 287k에서 언어당 5 k–30 k 페이지로 감소.
- 실제 검색 수요가 있는 비교 쌍만 유지 (Search Console 및 키워드 도구를 통해 검증).
남은 페이지를 풍부하게
- 섹터 맥락, 역사적 추세 분석, 배당 심층 분석, 각 주식 쌍에 특화된 맞춤 AI‑생성 인사이트 추가.
- 각 페이지가 독립적인 유용한 리소스로서 기능하도록 목표 설정.
백링크 구축
- 디렉터리 제출부터 시작 (지루하지만 필요).
- 산업별 디렉터리로 확대.
- 6개월 이내에 Domain Rating 15+ 달성을 위한 타깃 아웃리치 진행.
크롤링 예산 최적화
- 방대한 사이트맵을 주제별 작은 사이트맵으로 분할.
- 내부 링크 구조를 개선해 Googlebot이 사이트 구조를 통해 중요한 페이지를 발견하도록 함, 사이트맵에만 의존하지 않음.
- 가치가 낮은 페이지에는
noindex태그 사용.
현재 지표 (투명 스냅샷)
| Metric | Current |
|---|---|
| 전체 페이지 | 287,000 |
| 인덱싱된 페이지 | ~2,500 |
| 인덱스 비율 | 0.9 % |
| 도메인 평점 | 0 |
| 백링크 | 0 |
| 월간 수익 | $0 |
| 월간 비용 | ~ $50 |
예쁘지는 않지만 인프라가 작동합니다:
- 데이터 파이프라인 ✅
- 콘텐츠 생성 ✅
- 사이트 로드가 빠르고 Core Web Vitals 통과 ✅
- 모든 페이지에 적절한 스키마 마크업 적용 ✅
유일하게 문제가 되는 것은 Google의 신뢰이며, 이는 해결 가능한 문제입니다.
Source: …
Programmatic SEO – Lessons Learned & Playbook
1. Indexing & Growth
- 인덱싱이 병목 현상이다. 페이지가 인덱싱되기 시작하면 성장 속도가 급격히 가속된다.
- 인덱싱된 각 페이지는 경쟁이 거의 없는 키워드를 목표로 한다(실질적으로 다른 사이트가 순위에 오르지 않음).
- 12개 언어로 제공하면 잠재 시장 규모가 방대하다.
2. Start Smaller
“다시 할 수 있다면, 287 000 페이지가 아니라 5 000 페이지로 시작했을 텐데.”
- 먼저 적당한 양의 페이지를 인덱싱하도록 한다.
- 모델이 작동한다는 것을 입증한 뒤에 규모를 확대한다.
- 새 도메인에 수십만 페이지를 한 번에 올리는 것은 구글에게 무시당하도록 요구하는 것과 같다.
3. Your Data Source = Your Moat
- 템플릿은 누구나 복제할 수 있다; 진정한 강점은 포괄적이고 복제하기 어려운 데이터 소스에 있다.
- 예시:
yfinance를 통한 금융 데이터 – 무료, 구조화되어 있으며 수천 개의 엔터티를 포괄한다. - 스스로에게 물어보라: 다른 사람들이 대규모로 쉽게 복제할 수 없는 데이터는 무엇인가?
4. Template + AI Hybrid – The Sweet Spot
| 접근 방식 | 장점 | 단점 |
|---|---|---|
| 순수 템플릿 기반 페이지 | 빠르고 저렴 | 얇은 콘텐츠 → 구글에 의해 플래그될 수 있음 |
| 순수 AI 생성 페이지 | 매우 독창적 | 비용이 많이 들고 품질이 일관되지 않을 수 있음 |
| 하이브리드(구조화 데이터 + AI 서술) | 확장 가능, 독창적, 품질 높음 | 세심한 조정이 필요 |
- 구조화 데이터를 템플릿으로 렌더링한다.
- AI를 활용해 부가 가치와 독창성을 제공하는 서술 부분을 생성한다.
5. Budget for Backlinks from Day One
- 훌륭한 콘텐츠라도 도메인 권한이 전무한 상황에서는 자동으로 링크를 얻지 못한다.
- 백링크 확보를 런칭 계획의 핵심 요소로 삼고, 사후 작업이 되지 않도록 한다.
6. Patience Is a Must
- Programmatic SEO는 “런칭하고 내일 바로 순위 상승” 전략이 아니다.
- 시간이 지남에 따라 복리 효과가 나타나는 인프라 구축이라고 생각하라.
- 처음 6개월은 느리게 느껴질 수 있다—이는 정상적인 과정이다.
7. Documentation & Transparency
- 모든 과정을 문서화하고 있다:
- 전체 기술 아키텍처
- 콘텐츠 생성에 사용된 모든 프롬프트
- 수익화 로드맵
- 실수와 교훈
8. The Programmatic SEO Blueprint
다음 내용을 포함한 완전한 가이드:
- 니치 선택
- 데이터 아키텍처
- AI 콘텐츠 생성 워크플로우
- Astro/Next.js 구현 상세
- SEO 인프라 및 인덱싱 솔루션
- 수익화 전략
- 모든 코드 예시는 MIT 라이선스 적용
9. Final Thoughts & Call to Action
- Programmatic SEO 사이트 구축을 고민 중이라면, 도전해 보라—단, 작은 규모부터 시작하라.
- 팔로우하면 프로그램형 SEO 사이트 구축과 인덱싱 상황 변화에 대한 최신 정보를 받아볼 수 있다.
Programmatic SEO Blueprint 저자가 준비했습니다.