Show HN: 在100部电影上微调 Qwen2.5-7B 用于概率故事图

发布: 3天前 (2026年2月8日 GMT+8 20:00)

5 分钟阅读

Source: Hacker News

Overview

嗨，HN，我是一名在墨西哥的计算机系统工程专业学生，之前在电影学院学习。我创建 CineGraphs 是因为我和电影人朋友们总是碰到同一个瓶颈——我们有一个模糊的电影概念，却没有结构化的方式来探索它可能的发展方向。现有的 AI 写作工具往往产生千篇一律、公式化的输出，我也不想再做一个 ChatGPT 包装器，于是走了一条不同的路。

思路很简单：你输入一个粗略的概念，工具会生成分支的叙事路径并以图形方式可视化。你可以把这些分支雕塑成结构化的剧本格式，并导出为 Fountain，以便在专业的剧本软件中使用。

Training Data

大多数 AI 写作工具都是在通用的互联网文本上训练的，这也是它们输出千篇一律结果的原因。我想要的是能够理解真实电影叙事的模型——不是情节概要或维基百科的梗概，而是电影的结构性 DNA。

精选 100 部高质量电影，它们拥有独特的叙事结构（例如，戈达尔的跳切、黑泽明的平行人物弧线、布拉哈格的非线性视觉诗、塔可夫斯基的慢燃时间结构）。
使用 Qwen3‑VL 构建了一个 1000 行以上的 Python 流水线，对每部电影进行字幕启用的分析。
提取了场景级别的叙事节点、人物关系、主题线索以及对白模式。
大量迭代提示词，使模型能够识别诸如“这个场景呼应开场”或“这个人物的弧线与主角相反”等功能性元素。

基于这些提取，我生成了一个 10 K 示例数据集，包含 提示‑到‑分支叙事 对。

Model Fine‑tuning

使用 LoRA 对 Qwen2.5‑7B‑Instruct 进行微调，专门优化概率式故事分支。
LoRA 负责图形生成（探索可能的叙事方向），而完整的 7B 模型在导出时生成技术性的剧本格式。
选择 7B 模型是为了在规模化推理时保持成本可负担；整个系统在单块 RTX 4090 GPU 上运行，使用 vLLM。

Implementation

前端： 使用 React Flow 进行图形可视化。
关键洞见： 编剧本质上是关于做选择——如果角色向左而不是向右会怎样？——但大多数工具过早地把文档强制为线性。图形结构让作者在决定之前可以探索多条路径，契合早期创作的思维方式。

Results

电影的选择对效果影响巨大。早期在主流电影上训练的版本产生了公式化的输出。加入实验性和国际电影后，作品的多样性和趣味性显著提升。
模型似乎把叙事结构视为一个设计空间，而不是固定的公式。
在内部用于解决第二幕问题：分支格式迫使创作者考虑多种可能性，而不是过早地锁定方案。

Try It

你可以在 https://cinegraphs.ai/ 试用该工具——无需注册即可创建最多 50 条分支的完整项目。只有在需要保存工作时才需要创建账户；注册用户可获得 3 个免费项目。

我期待收到关于生成质量是否真的与通用 AI 工具有显著区别，以及图形界面是增值还是仅仅增加摩擦的反馈。

Show HN: 在100部电影上微调 Qwen2.5-7B 用于概率故事图

Overview

Training Data

Model Fine‑tuning

Implementation

Results

Try It

相关文章

Y Combinator CEO Garry Tan 启动暗钱组织以影响加州政治

科学家研究一名大脑缺失90%却过正常生活的男子 (2016)

美国在2025年几乎没有就业增长

Railway (PaaS) 全球宕机