[Paper] PaperDebugger：基于插件的多代理系统，用于编辑器内学术写作、审阅与编辑

发布: 2个月前 (2025年12月2日 GMT+8 18:00)

7 分钟阅读

原文: arXiv

Source: arXiv - 2512.02589v1

概述

PaperDebugger 是一个 Chrome 扩展，将 LaTeX 编辑器（如 Overleaf）转变为大语言模型（LLM）代理的协作工作空间。通过将助手直接嵌入编辑器，作者可以在不离开文档的情况下调用上下文感知推理、自动文献检索和结构化评审。作者展示了这种紧密集成是可行的，并已在真实的学术写作流程中发挥作用。

关键贡献

编辑器内多代理架构 – LLM 代理并行运行在编辑器内部，能够访问当前 LaTeX 源码、修订历史和参考文献。
基于插件的可扩展性 – 轻量级 Chrome 扩展加载“插件”（搜索、引用查找、评分等），可在运行时自由替换或组合。
模型上下文协议（MCP） – 一种自定义协议，用于同步细粒度文档补丁、版本控制以及编辑器 UI 与基于 Kubernetes 的编排层之间的安全状态。
并行代理调度 – 系统能够同时启动多个代理（例如，一个建议措辞，另一个核对引用），并将它们的 diff 合并回文档。
真实演示与分析 – 公开演示展示了端到端的编辑、评审和修订循环，早期使用指标证实研究者的活跃参与。

方法论

Chrome 扩展前端 – 扩展向 Overleaf（或任何基于网页的 LaTeX 编辑器）注入最小化 UI。它捕获当前文档快照并通过 WebSocket 将其转发至后端。
Kubernetes 编排 – 每一次 LLM 请求都会生成一个容器化代理。编排器负责负载均衡、弹性伸缩和隔离，确保多个代理能够同时运行而不相互干扰。
模型上下文协议（MCP） – MCP 定义了双向消息格式：
- 状态同步：编辑器 ↔︎ 代理发送完整的源码树和基于 diff 的补丁日志。
- 指令通道：UI 触发“检索文献”“检查引用”“改写段落”等操作。
- 安全性：敏感令牌和模型参数保留在服务器端，仅清理后的 diff 传输至客户端。
插件系统 – 插件是实现标准 MCP 处理器的轻量 Python/Node 模块。例如，“引用查找”插件查询 arXiv / Semantic Scholar，而“文档评分”插件使用微调 LLM 给出质量分数。
评估 – 作者从一个 beta 群组（≈30 名用户，2 周）收集交互日志，测量延迟、编辑接受率以及通过问卷获得的整体满意度。

结果与发现

指标	数值	解释
平均往返延迟（编辑器 ↔︎ 代理）	1.2 秒	对交互使用足够快
补丁接受率（作者保留的编辑）	68 %	大多数建议有用
并行代理加速	2.3 倍（相较于顺序执行）	并行带来显著的生产力提升
用户报告满意度（1‑5）	4.2	早期采用者的积极反馈
引文检索准确率（前3个结果）	92 %	可靠的文献检索集成

这些数据表明，编辑器内的 LLM 助手能够实现低延迟、高质量的建议，并在多个并发代理下保持良好的用户体验。

实际意义

降低上下文切换成本 – 研究者无需将文本复制粘贴到外部聊天机器人；助手直接作用于完整的 LaTeX 源码，保留宏、定制命令和参考文献文件。
自动化文献整理 – “搜索”插件可以拉取相关论文、自动生成 BibTeX 条目，甚至建议引用位置，显著缩短手动编目时间。
持续质量评分 – 实时文档评分帮助团队监控稿件成熟度，便于判断何时准备提交。
全团队协同编辑 – 系统追踪版本 diff，多个合著者可并发调用代理，编排器安全合并编辑，适合大型研究团队。
可扩展生态 – 组织可以开发专有插件（如特定期刊的合规检查），直接放入同一 UI，形成写作助理工具的市场。

对于开发者，开源仓库提供了即用的 Chrome 扩展、兼容 Docker‑compose 的后端以及清晰的 MCP 规范，便于快速原型化新代理或集成已有 LLM 服务。

局限性与未来工作

编辑器依赖 – 目前仅支持基于网页的 LaTeX 编辑器，未兼容本地桌面工具（如 TeXstudio）。
LLM 成本与延迟峰值 – 大模型可能导致响应时间增加，作者计划根据任务复杂度加入自适应模型选择。
安全与隐私 – 虽然 MCP 对数据进行清理，但将完整源码传输至远程服务器仍可能引发机密研究的顾虑；未来版本将致力于本地部署编排。
用户研究规模 – 本次评估的用户群体规模有限，需开展更大、跨学科的研究以验证普适性。

作者设想进一步扩展插件生态，支持其他科学写作格式（Word、Markdown），并探索与 GitHub 等版本控制平台的更紧密集成。

作者

Junyi Hou
Andre Lin Huikai
Nuo Chen
Yiwei Gong
Bingsheng He

论文信息

arXiv ID: 2512.02589v1
Categories: cs.AI, cs.SE
Published: December 2, 2025
PDF: Download PDF

[Paper] PaperDebugger：基于插件的多代理系统，用于编辑器内学术写作、审阅与编辑

概述

关键贡献

方法论

结果与发现

实际意义

局限性与未来工作

作者

论文信息

相关文章

[Paper] 用 Entity Linking 提升教育平台的 Retrieval-Augmented Generation

[Paper] 训练时动作条件化实现高效实时分块

[Paper] 只要剩下的必须为真：过滤驱动LLMs的推理，塑造多样性

[Paper] AQUA-Net：自适应频率融合与光照感知网络用于水下图像增强