Show HN: 在100部电影上微调 Qwen2.5-7B 用于概率故事图

发布: (2026年2月8日 GMT+8 20:00)
5 分钟阅读

Source: Hacker News

Overview

嗨,HN,我是一名在墨西哥的计算机系统工程专业学生,之前在电影学院学习。我创建 CineGraphs 是因为我和电影人朋友们总是碰到同一个瓶颈——我们有一个模糊的电影概念,却没有结构化的方式来探索它可能的发展方向。现有的 AI 写作工具往往产生千篇一律、公式化的输出,我也不想再做一个 ChatGPT 包装器,于是走了一条不同的路。

思路很简单:你输入一个粗略的概念,工具会生成分支的叙事路径并以图形方式可视化。你可以把这些分支雕塑成结构化的剧本格式,并导出为 Fountain,以便在专业的剧本软件中使用。

Training Data

大多数 AI 写作工具都是在通用的互联网文本上训练的,这也是它们输出千篇一律结果的原因。我想要的是能够理解真实电影叙事的模型——不是情节概要或维基百科的梗概,而是电影的结构性 DNA。

  • 精选 100 部高质量电影,它们拥有独特的叙事结构(例如,戈达尔的跳切、黑泽明的平行人物弧线、布拉哈格的非线性视觉诗、塔可夫斯基的慢燃时间结构)。
  • 使用 Qwen3‑VL 构建了一个 1000 行以上的 Python 流水线,对每部电影进行字幕启用的分析。
  • 提取了场景级别的叙事节点、人物关系、主题线索以及对白模式。
  • 大量迭代提示词,使模型能够识别诸如“这个场景呼应开场”或“这个人物的弧线与主角相反”等功能性元素。

基于这些提取,我生成了一个 10 K 示例数据集,包含 提示‑到‑分支叙事 对。

Model Fine‑tuning

  • 使用 LoRAQwen2.5‑7B‑Instruct 进行微调,专门优化概率式故事分支。
  • LoRA 负责图形生成(探索可能的叙事方向),而完整的 7B 模型在导出时生成技术性的剧本格式。
  • 选择 7B 模型是为了在规模化推理时保持成本可负担;整个系统在单块 RTX 4090 GPU 上运行,使用 vLLM

Implementation

  • 前端: 使用 React Flow 进行图形可视化。
  • 关键洞见: 编剧本质上是关于做选择——如果角色向左而不是向右会怎样?——但大多数工具过早地把文档强制为线性。图形结构让作者在决定之前可以探索多条路径,契合早期创作的思维方式。

Results

  • 电影的选择对效果影响巨大。早期在主流电影上训练的版本产生了公式化的输出。加入实验性和国际电影后,作品的多样性和趣味性显著提升。
  • 模型似乎把叙事结构视为一个设计空间,而不是固定的公式。
  • 在内部用于解决第二幕问题:分支格式迫使创作者考虑多种可能性,而不是过早地锁定方案。

Try It

你可以在 https://cinegraphs.ai/ 试用该工具——无需注册即可创建最多 50 条分支的完整项目。只有在需要保存工作时才需要创建账户;注册用户可获得 3 个免费项目

我期待收到关于生成质量是否真的与通用 AI 工具有显著区别,以及图形界面是增值还是仅仅增加摩擦的反馈。

0 浏览
Back to Blog

相关文章

阅读更多 »

Railway (PaaS) 全球宕机

事件时间线 - 调查中 – 2026年2月11日 下午3:07 我们目前正在调查此事件。 - 已识别 – 2026年2月11日 下午3:24 我们...