우리는 2M+ 연결을 가진 지식 그래프를 구축했습니다. 여기서 영화에 대해 밝혀진 내용은.

발행: (2026년 2월 16일 오전 10:17 GMT+9)
2 분 소요
원문: Dev.to

Source: Dev.to

스택

  • 엔터티 1.83 M개를 보유한 PostgreSQL 데이터베이스
  • 엔터티당 JSONB 데이터 컬럼 (평점, 장르, 감성, 스트리밍 제공 여부)
  • 관객 감성, 재시청 가능성, 장르 패턴, 비평가 평점을 가중치로 두는 맞춤 점수 알고리즘
  • 배우 → 영화 → 스튜디오 → 스트리밍 서비스 를 연결하는 지식 그래프 링크

데이터가 보여주는 내용

  • 품질 대신 편안함을 기준으로 191 000편의 영화를 점수화하면 순위가 뒤바뀝니다. 예시: The Godfather (평점 8.69)는 편안함 점수 29인 반면, Zootopia (평점 7.76)는 80점입니다.
  • 관객 평점과 Feelgood Score 간의 상관관계는 거의 0에 가깝습니다 – 품질과 편안함이 독립적인 것으로 보입니다.

영화 데이터베이스 통계

  • 추적된 전체 영화 수: 209 684편
  • 대표 언어 수: 113개
  • 추적된 총 박스오피스 매출: 8,207억 달러
  • 수익을 낸 영화: 1 126편 (재무 데이터가 있는 영화의 5.5 %)
  • 스트리밍 제공 기록: 678개 서비스에 걸쳐 685 896건

리소스

연락처

대규모 엔터티 데이터베이스나 지식 그래프를 구축하고 있다면, 아키텍처에 대해 논의하고 싶을 때 언제든지 연락 주세요.

0 조회
Back to Blog

관련 글

더 보기 »

PostgreSQL의 부분 인덱스

Partial indexes는 특정 액세스 패턴을 목표로 하는 정교한 인덱스입니다. 테이블의 모든 행을 인덱싱하는 대신, 조건에 맞는 행만 인덱싱합니다.