Show HN: 100편의 영화에 대해 확률적 스토리 그래프를 위해 파인튜닝된 Qwen2.5-7B

발행: (2026년 2월 8일 오후 09:00 GMT+9)
6 분 소요

Source: Hacker News

Overview

안녕하세요 HN, 저는 멕시코에서 영화 학교를 전전하던 컴퓨터 시스템 공학 전공 학생입니다. CineGraphs를 만든 이유는 저와 영화 제작자 친구들이 같은 문제에 부딪혔기 때문입니다—영화에 대한 막연한 아이디어는 있었지만, 그것을 어디로 확장할지 구조화된 방법이 없었습니다. 기존 AI 작문 도구들은 일반적이고 공식적인 결과만을 내놓았고, 또 다른 ChatGPT 래퍼를 만들고 싶지 않아서 다른 접근 방식을 택했습니다.

아이디어는 간단합니다: 거친 컨셉을 입력하면 도구가 그래프로 시각화된 분기 내러티브 경로를 생성합니다. 그런 뒤 그 분기들을 구조화된 시나리오 형식으로 다듬고 Fountain 형식으로 내보내어 전문 시나리오 소프트웨어에서 사용할 수 있습니다.

Training Data

대부분의 AI 작문 도구는 일반 인터넷 텍스트를 학습하기 때문에 결과도 일반적입니다. 저는 실제 영화 스토리텔링을 이해하는 모델을 원했습니다—플롯 요약이나 위키피디아 개요가 아니라 영화의 구조적 DNA 말이죠.

  • 독특한 서사 구조를 가진 100편의 고품질 영화를 선별 (예: 고다르의 점프 컷, 쿠로사와의 평행 인물 아크, 브라카게의 비선형 시각 시 poetry, 타르코프스키의 느린 시간 구조).
  • Qwen3‑VL을 사용해 자막을 활성화한 상태로 각 영화를 분석하는 1000줄 이상의 Python 파이프라인을 구축.
  • 씬 수준의 서사 비트, 인물 관계, 주제 흐름, 대사 패턴을 추출.
  • “이 씬은 오프닝을 반영한다” 혹은 “이 인물의 아크가 주인공의 아크를 뒤집는다”와 같은 기능적 요소를 모델이 인식하도록 프롬프트를 반복적으로 다듬음.

이 추출물을 바탕으로 프롬프트‑대‑분기 내러티브 쌍으로 구성된 10 K 예시 데이터셋을 생성했습니다.

Model Fine‑tuning

  • Qwen2.5‑7B‑InstructLoRA와 함께 미세조정하여 확률적 스토리 분기를 최적화.
  • LoRA는 그래프 생성(가능한 서사 방향 탐색)을 담당하고, 전체 7B 모델은 내보낼 때 기술적인 시나리오 형식을 생성합니다.
  • 비용 효율적인 추론을 위해 7B 모델을 선택했으며, 전체 시스템은 RTX 4090 GPU 하나와 vLLM으로 구동됩니다.

Implementation

  • 프론트엔드: 그래프 시각화를 위한 React Flow.
  • 핵심 인사이트: 시나리오 작가는 본질적으로 선택을 만드는 일—“캐릭터가 오른쪽 대신 왼쪽으로 간다면?”—하지만 대부분의 도구는 너무 일찍 선형 문서 형태를 강요합니다. 그래프 구조는 작가가 여러 경로를 탐색한 뒤에야 결정을 내릴 수 있게 해 주어 초기 개발 단계 사고와 맞닿아 있습니다.

Results

  • 영화 선택이 결과에 큰 영향을 미쳤습니다. 초기 버전은 주류 영화를 학습해 공식적인 출력만을 만들었지만, 실험 영화와 국제 영화를 추가하면서 다양성과 흥미도가 크게 향상되었습니다.
  • 모델은 서사 구조를 고정된 공식이라기보다 설계 공간으로 다루는 듯합니다.
  • 내부적으로는 2막 문제를 해결하는 데 활용되었습니다: 분기 형식이 조기 커밋 대신 가능한 선택들을 고려하도록 강제합니다.

Try It

도구를 https://cinegraphs.ai/ 에서 테스트해 보세요—가입 없이도 최대 50개의 분기를 가진 전체 프로젝트를 이용할 수 있습니다. 작업을 저장하려면 계정 생성이 필요하며, 등록 사용자는 무료 프로젝트 3개를 받습니다.

생성 품질이 일반 AI 도구와 의미 있게 차별화되는지, 그래프 인터페이스가 가치를 더하는지 아니면 불편함만 주는지에 대한 피드백을 기다립니다.

0 조회
Back to Blog

관련 글

더 보기 »

U.S., 2025년 고용 성장 거의 없음

미국 경제는 2025년에 거의 제로에 가까운 일자리 증가를 보였으며, 이는 수정된 연방 데이터에 따른 것이다. 그러나 2026년에는 채용이 회복되었다. 수정된 Job Growth Figures는…

Railway (PaaS) 전 세계 장애

사건 타임라인 - 조사 중 – 2026년 2월 11일 오후 3시 07분 현재 이 사건을 조사하고 있습니다. - 확인됨 – 2026년 2월 11일 오후 3시 24분 우리는…