[Paper] PaperDebugger:基于插件的多代理系统,用于编辑器内学术写作、审阅与编辑
发布: (2025年12月2日 GMT+8 18:00)
7 min read
原文: arXiv
Source: arXiv - 2512.02589v1
概述
PaperDebugger 是一个 Chrome 扩展,将 LaTeX 编辑器(如 Overleaf)转变为大语言模型(LLM)代理的协作工作空间。通过将助手直接嵌入编辑器,作者可以在不离开文档的情况下调用上下文感知推理、自动文献检索和结构化评审。作者展示了这种紧密集成是可行的,并已在真实的学术写作流程中发挥作用。
关键贡献
- 编辑器内多代理架构 – LLM 代理并行运行在编辑器内部,能够访问当前 LaTeX 源码、修订历史和参考文献。
- 基于插件的可扩展性 – 轻量级 Chrome 扩展加载“插件”(搜索、引用查找、评分等),可在运行时自由替换或组合。
- 模型上下文协议(MCP) – 一种自定义协议,用于同步细粒度文档补丁、版本控制以及编辑器 UI 与基于 Kubernetes 的编排层之间的安全状态。
- 并行代理调度 – 系统能够同时启动多个代理(例如,一个建议措辞,另一个核对引用),并将它们的 diff 合并回文档。
- 真实演示与分析 – 公开演示展示了端到端的编辑、评审和修订循环,早期使用指标证实研究者的活跃参与。
方法论
- Chrome 扩展前端 – 扩展向 Overleaf(或任何基于网页的 LaTeX 编辑器)注入最小化 UI。它捕获当前文档快照并通过 WebSocket 将其转发至后端。
- Kubernetes 编排 – 每一次 LLM 请求都会生成一个容器化代理。编排器负责负载均衡、弹性伸缩和隔离,确保多个代理能够同时运行而不相互干扰。
- 模型上下文协议(MCP) – MCP 定义了双向消息格式:
- 状态同步:编辑器 ↔︎ 代理 发送完整的源码树和基于 diff 的补丁日志。
- 指令通道:UI 触发“检索文献”“检查引用”“改写段落”等操作。
- 安全性:敏感令牌和模型参数保留在服务器端,仅清理后的 diff 传输至客户端。
- 插件系统 – 插件是实现标准 MCP 处理器的轻量 Python/Node 模块。例如,“引用查找”插件查询 arXiv / Semantic Scholar,而“文档评分”插件使用微调 LLM 给出质量分数。
- 评估 – 作者从一个 beta 群组(≈30 名用户,2 周)收集交互日志,测量延迟、编辑接受率以及通过问卷获得的整体满意度。
结果与发现
| 指标 | 数值 | 解释 |
|---|---|---|
| 平均往返延迟(编辑器 ↔︎ 代理) | 1.2 秒 | 对交互使用足够快 |
| 补丁接受率(作者保留的编辑) | 68 % | 大多数建议有用 |
| 并行代理加速 | 2.3 倍(相较于顺序执行) | 并行带来显著的生产力提升 |
| 用户报告满意度(1‑5) | 4.2 | 早期采用者的积极反馈 |
| 引文检索准确率(前3个结果) | 92 % | 可靠的文献检索集成 |
这些数据表明,编辑器内的 LLM 助手能够实现低延迟、高质量的建议,并在多个并发代理下保持良好的用户体验。
实际意义
- 降低上下文切换成本 – 研究者无需将文本复制粘贴到外部聊天机器人;助手直接作用于完整的 LaTeX 源码,保留宏、定制命令和参考文献文件。
- 自动化文献整理 – “搜索”插件可以拉取相关论文、自动生成 BibTeX 条目,甚至建议引用位置,显著缩短手动编目时间。
- 持续质量评分 – 实时文档评分帮助团队监控稿件成熟度,便于判断何时准备提交。
- 全团队协同编辑 – 系统追踪版本 diff,多个合著者可并发调用代理,编排器安全合并编辑,适合大型研究团队。
- 可扩展生态 – 组织可以开发专有插件(如特定期刊的合规检查),直接放入同一 UI,形成写作助理工具的市场。
对于开发者,开源仓库提供了即用的 Chrome 扩展、兼容 Docker‑compose 的后端以及清晰的 MCP 规范,便于快速原型化新代理或集成已有 LLM 服务。
局限性与未来工作
- 编辑器依赖 – 目前仅支持基于网页的 LaTeX 编辑器,未兼容本地桌面工具(如 TeXstudio)。
- LLM 成本与延迟峰值 – 大模型可能导致响应时间增加,作者计划根据任务复杂度加入自适应模型选择。
- 安全与隐私 – 虽然 MCP 对数据进行清理,但将完整源码传输至远程服务器仍可能引发机密研究的顾虑;未来版本将致力于本地部署编排。
- 用户研究规模 – 本次评估的用户群体规模有限,需开展更大、跨学科的研究以验证普适性。
作者设想进一步扩展插件生态,支持其他科学写作格式(Word、Markdown),并探索与 GitHub 等版本控制平台的更紧密集成。
作者
- Junyi Hou
- Andre Lin Huikai
- Nuo Chen
- Yiwei Gong
- Bingsheng He
论文信息
- arXiv ID: 2512.02589v1
- Categories: cs.AI, cs.SE
- Published: December 2, 2025
- PDF: Download PDF