[Paper] SUMFORU：基于LLM的评论摘要框架，用于个性化购买决策支持

发布: 1个月前 (2025年12月13日 GMT+8 02:05)

7 分钟阅读

原文: arXiv

Source: arXiv - 2512.11755v1

概览

本文提出 SUMFORU，一个利用大语言模型（LLM）生成针对单个购物者偏好的商品评论摘要的新框架。通过将摘要器与明确的用户画像对齐，系统旨在从成千上万的在线评论中筛选噪声，提供简洁、与个人相关的决策支持内容。

画像感知的摘要流水线，将 LLM 输出引导至用户声明的偏好（例如“预算敏感”“环保友好”）。
两阶段对齐策略：
1. 监督微调 (SFT)，结合非对称知识蒸馏将画像信号注入模型。
2. 基于 AI 反馈的强化学习 (RLAIF)，利用学习到的偏好估计器对模型进行细粒度、画像特定的微调。
高质量数据构建，来源于 Amazon 2023 评论数据集，包含自动清洗、去重和画像标注。
全面评估，涵盖规则指标（一致性、依据性）、LLM 判官以及人工评估，显示相较于通用基线的持续提升。
展示了对未见商品类别的泛化能力，表明对齐方法的鲁棒性。

数据流水线 – 作者抓取 Amazon 2023 评论数据集，过滤低质量或重复条目，并使用关键词启发式和小规模种子分类器自动生成 画像标签（如“价格敏感”“性能导向”）。
阶段‑1：画像感知 SFT – 在清洗后的评论‑摘要对上微调基础 LLM（如 LLaMA‑2）。非对称知识蒸馏将更大“教师”模型的知识复制到较小“学生”模型，同时注入画像嵌入，使模型学会依据用户画像条件化输出。
阶段‑2：RLAIF – 单独的偏好估计器（在少量人工标注的画像‑摘要对上训练）预测生成摘要与给定画像的匹配程度。该估计器提供奖励信号用于强化学习，使模型在无需昂贵人工反馈的情况下提升画像对齐度。
推理 – 运行时，开发者提供 画像向量（或文本描述）以及商品 ID。模型生成简洁、基于事实的摘要，突出对该画像最相关的方面。

电商平台可将 SUMFORU 作为插件嵌入，为每位购物者生成“个性化亮点”，降低决策疲劳，潜在提升转化率。
开发者 API：框架可作为微服务暴露，开发者发送商品 ID 与 JSON 编码的画像，服务返回 2‑3 句摘要。此方式可无缝接入推荐流水线或聊天机器人助理。
降低人工策划依赖——营销人员无需编写多套画像特定文案，模型可按需自动生成。
提升可访问性——简洁、画像对齐的摘要帮助时间有限或认知负荷较大的用户（如老年人、神经多样化用户）做出明智购买。
数据驱动的个性化——因偏好估计器基于真实用户反馈训练，系统可随消费重点变化（例如对可持续性的关注上升）而演进。

SUMFORU 展示了可操控的 LLM 对齐如何将评论摘要从“一刀切”工具转变为真正个性化的决策支持利器，为更智能、以用户为中心的电商体验开辟新路径。