나는 287,000페이지 웹사이트를 만들었다. 여기서 배운 Programmatic SEO.

발행: (2026년 3월 10일 오전 10:37 GMT+9)
13 분 소요
원문: Dev.to

Source: Dev.to

대부분의 SEO 조언은 같은 내용으로 귀결됩니다

  • 키워드를 선택합니다.
  • 글을 작성합니다.
  • 3개월을 기다립니다.
  • 반복합니다.

트래픽을 10× 원한다면, **10×**의 콘텐츠를 작성해야 합니다. 하지만 혼자서 팀을 운영할 때는 이 수식이 통하지 않습니다.

다른 접근법

약 1년 전, 나는 프로그래밍 방식 방법을 실험하기 시작했습니다:

  • 글을 하나씩 쓰는 대신, 프로그래밍 방식으로 페이지를 생성하는 시스템을 구축했습니다.
  • 하나의 템플릿 + 하나의 데이터 파이프라인 = 수천 개의 출력 페이지.
  • 각 페이지는 특정 롱테일 키워드를 목표로 합니다.

노력은 기계를 구축하는 데 들어가며, 기계에 데이터를 공급하는 데는 들어가지 않습니다.

The project: a stock comparison engine

  • Input – 두 개의 티커 심볼.
  • Output – 나란히 비교: 재무, 배당금, 성장 지표 등.
  • Scale12개 언어에 걸친 모든 의미 있는 주식 쌍.

Result: 287,000 페이지를 한 사람이 구축했습니다. 콘텐츠 팀은 없습니다.

실제로 일어난 일

기술 스택

ComponentRole
Astro정적 사이트 생성 – 빠르고 SEO‑친화적이며 수천 개의 라우트를 처리
Supabase PostgreSQL데이터 레이어
yfinance API금융 데이터 가져오기
Local Llama 3각 페이지에 대한 서술 섹션 생성
Cloudflare CDN정적 파일 제공

월간 총 비용: $50 이하.

핵심 인사이트

데이터프레젠테이션을 분리한다.

  • 데이터베이스는 8,000개 이상의 티커에 대한 구조화된 금융 데이터를 저장한다.
  • 템플릿은 해당 데이터를 비교 페이지로 렌더링하는 방식을 정의한다.
  • AI가 빈틈을 메워—각 쌍에 고유한 인간 친화적인 분석을 생성한다.

아키텍처 다이어그램

Data Layer (Supabase PostgreSQL)

ETL Pipeline (Python + yfinance)

Content Generation (Llama 3 – local)

Static Site Generator (Astro)

CDN (Cloudflare)

각 레이어가 독립적이어서 교체(예: Astro → Next.js, Llama 3 → Claude)가 손쉽다.

롱테일 커버리지

  • 모든 주식 쌍에 대한 페이지를 만들면 다른 사람이 타깃팅하지 않는 검색을 포착한다.
  • 예시: “Random small‑cap vs other random small‑cap”은 거의 경쟁이 없다.
  • 개별 페이지 트래픽은 작지만 287k 페이지 전체의 누적 트래픽은 상당히 크다.

다국어 지원

  • 템플릿과 데이터 파이프라인이 준비되면 12개 언어로 번역하는 것은 주로 템플릿 문자열을 번역하고 페이지를 재생성하는 일이다.
  • 숫자, 티커, 퍼센트는 그대로 유지된다.
  • 초기 번역은 AI를 사용하고, 가장 중요한 페이지는 수작업으로 다듬었다.

대규모 스키마 마크업

  • 모든 페이지에 FinancialProduct, FAQ, BreadcrumbList 스키마가 포함된다.
  • 프로그래밍 방식이므로 스키마를 한 번만 작성하면 287k 페이지 모두에 적용된다—수동으로는 불가능한 작업이다.

안정성

  • 빌드 파이프라인은 정적이며 구조화된 데이터에서 생성되므로 런타임에 문제가 발생할 가능성이 거의 없다.
  • 사이트는 순수 HTML 파일만 제공—서버‑사이드 처리, 페이지 로드 시 DB 쿼리, 충돌 위험이 전혀 없다.

숨겨진 문제: Google이 새 도메인에서 287k 페이지를 색인하지 않음

  • 색인된 페이지: 약 2,500개 (≈ 0.9 % 색인 비율).
  • 근본 원인:
    1. 도메인 권한 부족 – 백링크가 전혀 없고 브랜드 인지도도 없음.
    2. 콘텐츠 유사성 – 서술 방식이 비슷해 Google의 “유용한 콘텐츠” 필터에 걸려 얇은 페이지로 판단됨.
    3. 크롤링 예산 – Googlebot이 하루에 200‑500 페이지만 방문했으며, 이 속도로는 모든 페이지를 크롤링하는 데 수년이 걸리고 Google은 가치가 낮다고 판단한 페이지를 크롤링하지 않음.

직관에 반하는 해결책: 더 많은 페이지가 아니라 적은 페이지

  1. 페이지를 과감히 축소

    • 287k에서 언어당 5 k–30 k 페이지로 감소.
    • 실제 검색 수요가 있는 비교 쌍만 유지 (Search Console 및 키워드 도구를 통해 검증).
  2. 남은 페이지를 풍부하게

    • 섹터 맥락, 역사적 추세 분석, 배당 심층 분석, 각 주식 쌍에 특화된 맞춤 AI‑생성 인사이트 추가.
    • 각 페이지가 독립적인 유용한 리소스로서 기능하도록 목표 설정.
  3. 백링크 구축

    • 디렉터리 제출부터 시작 (지루하지만 필요).
    • 산업별 디렉터리로 확대.
    • 6개월 이내에 Domain Rating 15+ 달성을 위한 타깃 아웃리치 진행.
  4. 크롤링 예산 최적화

    • 방대한 사이트맵을 주제별 작은 사이트맵으로 분할.
    • 내부 링크 구조를 개선해 Googlebot이 사이트 구조를 통해 중요한 페이지를 발견하도록 함, 사이트맵에만 의존하지 않음.
    • 가치가 낮은 페이지에는 noindex 태그 사용.

현재 지표 (투명 스냅샷)

MetricCurrent
전체 페이지287,000
인덱싱된 페이지~2,500
인덱스 비율0.9 %
도메인 평점0
백링크0
월간 수익$0
월간 비용~ $50

예쁘지는 않지만 인프라가 작동합니다:

  • 데이터 파이프라인 ✅
  • 콘텐츠 생성 ✅
  • 사이트 로드가 빠르고 Core Web Vitals 통과 ✅
  • 모든 페이지에 적절한 스키마 마크업 적용 ✅

유일하게 문제가 되는 것은 Google의 신뢰이며, 이는 해결 가능한 문제입니다.

Source:

Programmatic SEO – Lessons Learned & Playbook

1. Indexing & Growth

  • 인덱싱이 병목 현상이다. 페이지가 인덱싱되기 시작하면 성장 속도가 급격히 가속된다.
  • 인덱싱된 각 페이지는 경쟁이 거의 없는 키워드를 목표로 한다(실질적으로 다른 사이트가 순위에 오르지 않음).
  • 12개 언어로 제공하면 잠재 시장 규모가 방대하다.

2. Start Smaller

“다시 할 수 있다면, 287 000 페이지가 아니라 5 000 페이지로 시작했을 텐데.”

  • 먼저 적당한 양의 페이지를 인덱싱하도록 한다.
  • 모델이 작동한다는 것을 입증한 뒤에 규모를 확대한다.
  • 새 도메인에 수십만 페이지를 한 번에 올리는 것은 구글에게 무시당하도록 요구하는 것과 같다.

3. Your Data Source = Your Moat

  • 템플릿은 누구나 복제할 수 있다; 진정한 강점은 포괄적이고 복제하기 어려운 데이터 소스에 있다.
  • 예시: yfinance를 통한 금융 데이터 – 무료, 구조화되어 있으며 수천 개의 엔터티를 포괄한다.
  • 스스로에게 물어보라: 다른 사람들이 대규모로 쉽게 복제할 수 없는 데이터는 무엇인가?

4. Template + AI Hybrid – The Sweet Spot

접근 방식장점단점
순수 템플릿 기반 페이지빠르고 저렴얇은 콘텐츠 → 구글에 의해 플래그될 수 있음
순수 AI 생성 페이지매우 독창적비용이 많이 들고 품질이 일관되지 않을 수 있음
하이브리드(구조화 데이터 + AI 서술)확장 가능, 독창적, 품질 높음세심한 조정이 필요
  • 구조화 데이터를 템플릿으로 렌더링한다.
  • AI를 활용해 부가 가치와 독창성을 제공하는 서술 부분을 생성한다.
  • 훌륭한 콘텐츠라도 도메인 권한이 전무한 상황에서는 자동으로 링크를 얻지 못한다.
  • 백링크 확보를 런칭 계획의 핵심 요소로 삼고, 사후 작업이 되지 않도록 한다.

6. Patience Is a Must

  • Programmatic SEO는 “런칭하고 내일 바로 순위 상승” 전략이 아니다.
  • 시간이 지남에 따라 복리 효과가 나타나는 인프라 구축이라고 생각하라.
  • 처음 6개월은 느리게 느껴질 수 있다—이는 정상적인 과정이다.

7. Documentation & Transparency

  • 모든 과정을 문서화하고 있다:
    • 전체 기술 아키텍처
    • 콘텐츠 생성에 사용된 모든 프롬프트
    • 수익화 로드맵
    • 실수와 교훈

8. The Programmatic SEO Blueprint

다음 내용을 포함한 완전한 가이드:

  1. 니치 선택
  2. 데이터 아키텍처
  3. AI 콘텐츠 생성 워크플로우
  4. Astro/Next.js 구현 상세
  5. SEO 인프라 및 인덱싱 솔루션
  6. 수익화 전략
  7. 모든 코드 예시는 MIT 라이선스 적용

9. Final Thoughts & Call to Action

  • Programmatic SEO 사이트 구축을 고민 중이라면, 도전해 보라—단, 작은 규모부터 시작하라.
  • 팔로우하면 프로그램형 SEO 사이트 구축과 인덱싱 상황 변화에 대한 최신 정보를 받아볼 수 있다.

Programmatic SEO Blueprint 저자가 준비했습니다.

0 조회
Back to Blog

관련 글

더 보기 »

Power BI를 PostgreSQL 데이터베이스에 연결

소개 Power BI는 Microsoft에서 제공하는 비즈니스 인텔리전스 및 데이터 시각화 도구로, 사용자가 다양한 데이터 소스에 연결하고 데이터를 변환하고 수정할 수 있게 해줍니다…