[Paper] SUMFORU:基于LLM的评论摘要框架,用于个性化购买决策支持

发布: (2025年12月13日 GMT+8 02:05)
7 min read
原文: arXiv

Source: arXiv - 2512.11755v1

概览

本文提出 SUMFORU,一个利用大语言模型(LLM)生成针对单个购物者偏好的商品评论摘要的新框架。通过将摘要器与明确的用户画像对齐,系统旨在从成千上万的在线评论中筛选噪声,提供简洁、与个人相关的决策支持内容。

关键贡献

  • 画像感知的摘要流水线,将 LLM 输出引导至用户声明的偏好(例如“预算敏感”“环保友好”)。
  • 两阶段对齐策略
    1. 监督微调 (SFT),结合非对称知识蒸馏将画像信号注入模型。
    2. 基于 AI 反馈的强化学习 (RLAIF),利用学习到的偏好估计器对模型进行细粒度、画像特定的微调。
  • 高质量数据构建,来源于 Amazon 2023 评论数据集,包含自动清洗、去重和画像标注。
  • 全面评估,涵盖规则指标(一致性、依据性)、LLM 判官以及人工评估,显示相较于通用基线的持续提升。
  • 展示了对未见商品类别的泛化能力,表明对齐方法的鲁棒性。

方法论

  1. 数据流水线 – 作者抓取 Amazon 2023 评论数据集,过滤低质量或重复条目,并使用关键词启发式和小规模种子分类器自动生成 画像标签(如“价格敏感”“性能导向”)。
  2. 阶段‑1:画像感知 SFT – 在清洗后的评论‑摘要对上微调基础 LLM(如 LLaMA‑2)。非对称知识蒸馏将更大“教师”模型的知识复制到较小“学生”模型,同时注入画像嵌入,使模型学会依据用户画像条件化输出。
  3. 阶段‑2:RLAIF – 单独的偏好估计器(在少量人工标注的画像‑摘要对上训练)预测生成摘要与给定画像的匹配程度。该估计器提供奖励信号用于强化学习,使模型在无需昂贵人工反馈的情况下提升画像对齐度。
  4. 推理 – 运行时,开发者提供 画像向量(或文本描述)以及商品 ID。模型生成简洁、基于事实的摘要,突出对该画像最相关的方面。

结果与发现

评估基线(通用)SUMFORU(SFT + RLAIF)
一致性(规则‑基)71.2 %84.9 %
依据性(评论事实)68.5 %81.3 %
画像偏好对齐(LLM 判官)0.62(类 BLEU)0.78
人工偏好得分(1‑5)3.44.3
  • 一致性与依据性提升,因为两阶段对齐迫使模型忠实于源评论,同时遵守画像约束。
  • 偏好对齐显著跳升,证明 RLAIF 阶段捕获了 SFT 单独无法捕获的细粒度用户信号。
  • 跨类别测试(例如在电子产品上训练、在家居用品上测试)仅出现约 3 % 的下降,说明方法具有良好泛化性。

实际意义

  • 电商平台可将 SUMFORU 作为插件嵌入,为每位购物者生成“个性化亮点”,降低决策疲劳,潜在提升转化率。
  • 开发者 API:框架可作为微服务暴露,开发者发送商品 ID 与 JSON 编码的画像,服务返回 2‑3 句摘要。此方式可无缝接入推荐流水线或聊天机器人助理。
  • 降低人工策划依赖——营销人员无需编写多套画像特定文案,模型可按需自动生成。
  • 提升可访问性——简洁、画像对齐的摘要帮助时间有限或认知负荷较大的用户(如老年人、神经多样化用户)做出明智购买。
  • 数据驱动的个性化——因偏好估计器基于真实用户反馈训练,系统可随消费重点变化(例如对可持续性的关注上升)而演进。

局限性与未来工作

  • 画像定义粒度——当前方法依赖预定义的画像标签集合,过于粗糙的画像可能遗漏细分偏好。
  • 反馈回路成本——虽然 RLAIF 减少了昂贵的人类标注,但训练偏好估计器仍需精心策划的数据集,对小型供应商可能构成门槛。
  • 潜在偏见——模型继承了 Amazon 评论语料中的偏见;未来工作应引入偏见缓解技术与公平性审计。
  • 实时适应——将框架扩展至即时更新画像嵌入(例如基于购物者浏览历史)仍是开放的研究方向。

SUMFORU 展示了可操控的 LLM 对齐如何将评论摘要从“一刀切”工具转变为真正个性化的决策支持利器,为更智能、以用户为中心的电商体验开辟新路径。

作者

  • 冯宇明
  • 姜欣瑞

论文信息

  • arXiv ID: 2512.11755v1
  • 类别: cs.CL
  • 发布时间: 2025 年 12 月 12 日
  • PDF: Download PDF
Back to Blog

相关文章

阅读更多 »