[Paper] 动态定价下的锚点-恢复让步用于LLM增强的货运谈判

发布: 2天前 (2026年4月23日 GMT+8 00:17)

8 分钟阅读

原文: arXiv

Source: arXiv - 2604.20732v1

概览

本文针对货运经纪平台的一个现实痛点——在快速变化、动态定价的市场中协商承运人费率——提出了解决方案。传统的让步模型使用静态的 “β” 参数，无法跟上对话中途的价格变动；而大型语言模型（LLMs）虽然提供了灵活性，却带来了延迟、非确定性以及安全风险。作者引入了一种 双索引 “锚点‑恢复” 框架，该框架能够将让步曲线实时适配市场价差并且保证报价永不倒退，同时保持定价逻辑的确定性，仅将自然语言翻译的工作交给 LLM。

关键贡献

基于价差的自适应 β: 直接从当前价格差距中推导让步形状参数，自动根据谈判情境调节激进程度。
锚定并恢复机制: 即使在对话中途目标价格被修改，也能保证出价单调（不下降），消除以往公式中的“价格回撤”错误。
确定性定价核心: 所有价格计算均由闭式公式完成；大语言模型仅用于在人类可读语言与公式输入/输出之间进行转换。
可扩展评估: 在 115 k 场真实谈判中测试，显示相较于固定‑β 基线和一个 200 亿参数的大语言模型经纪人，能够实现相当或更好的经纪人节省和达成率。
对随机载体的鲁棒性: 在与引入随机性的 LLM‑驱动的承运人代理进行谈判时，仍能保持更高的达成率和节省。

方法论

边际‑价差映射 – 对于每个货运，系统计算价差（承运人成本与经纪人目标之间的差额）。该价差输入一个简单函数，输出针对当前市场紧张程度（紧、适中、宽松）定制的 β 值。
让步公式 – 使用自适应 β，经纪人的报价遵循经典的随时间变化的让步曲线（例如指数衰减），决定价格向目标靠拢的速度。
锚定‑恢复逻辑
- 锚定： 当出现定价变动（例如目标上调）时，当前报价被“锚定”为新的基准。
- 恢复： 之后的让步相对于该锚定值计算，确保后续报价永不低于锚定价格。
LLM 集成（可选） – LLM 接收确定性的报价并生成面向承运人的自然语言信息（如“我们可以以每英里 $X 的价格接受”）。逆向翻译（承运人的文字回复 → 数值意图）同样由 LLM 处理，但核心价格永不经过模型。
实验设置 – 作者回放了 115 125 条历史谈判记录，比较了以下几种方案：
- 固定‑β 基线（静态让步曲线）
- 提出的自适应‑β + 锚定‑恢复系统
- 完整的 LLM 经纪人（20 B 参数）
- 由 LLM 驱动的模拟随机承运人代理

Results & Findings

指标	Fixed‑β Baseline	Adaptive‑β + Anchor‑Resume	20B‑Parameter LLM Broker
Broker Savings (vs. optimal)	Up to 3 % loss in wide spreads	Matches or exceeds baseline (up to 2 % better)	Similar savings
Agreement Rate	78 % (narrow), 65 % (wide)	81 % (narrow), 68 % (wide)	80 % (narrow), 67 % (wide)
Latency per negotiation	< 5 ms (pure formula)	< 5 ms (formula) + optional LLM translation (~30 ms)	~200 ms (full LLM inference)
Scalability	Linear, cheap	Linear, cheap	Limited by GPU inference cost

Regime‑aware behavior: 在紧张的价差下，adaptive β 促使经纪人快速让步，提升负载覆盖率；在宽松的价差下则保持克制，保留利润空间。
Monotonicity guarantee: 没有任何谈判出现价格“回退”，从而消除运营商常见的挫败感。
Cost efficiency: 通过将大量计算工作保留在确定性公式中，系统能够以极低的云计算成本处理数千个并发聊天。

实际意义

对于货运平台： 部署轻量级定价引擎，能够在市场波动时即时响应，而无需庞大的 LLM 推理开销。
对于构建谈判机器人的开发者： 将 决策逻辑（确定性数学）与 沟通层（LLM 生成的文本）分离，以实现透明性和对话的精致度。
成本节约： 大幅降低推理支出——从数百毫秒、GPU 密集型的 LLM 调用，转为亚毫秒级的 CPU 计算。
合规性与可审计性： 确定性公式为定价决策提供清晰的审计轨迹，简化监管报告和内部治理。
可扩展性： anchor‑and‑resume 模式可应用于任何动态定价场景（例如，网约车的 surge 定价、广告出价谈判），在交互过程中目标值会发生变化。

限制与未来工作

依赖准确的价差估计： 自适应 β 假设价差被正确测量；噪声成本数据可能导致让步激进性调校错误。
LLM 翻译质量： 虽然定价核心是确定性的，但自然语言层仍继承 LLM 的怪癖（例如偶尔的措辞错误或提示注入漏洞）。
实时市场冲击： 突然的、极端的价格飙升可能需要超出锚定‑恢复逻辑的额外保护措施（例如硬上限）。
未来方向：
- 将强化学习引入，以根据实时谈判结果微调 β 更新。
- 探索混合模型，即轻量化、领域特定的 LLM 在边缘案例推理中提供帮助，而核心保持公式化。
- 将框架扩展到多方谈判（例如经纪人‑承运人‑托运人三方）以及其他物流垂直领域。

作者

Hoang Nguyen
Lu Wang
Marta Gaia Bras

论文信息

arXiv ID: 2604.20732v1
类别: cs.MA, cs.AI, cs.CL
发表时间: 2026年4月22日
PDF: Download PDF

[Paper] 动态定价下的锚点-恢复让步用于LLM增强的货运谈判

概览

关键贡献

方法论

Results & Findings

实际意义

限制与未来工作

作者

论文信息

相关文章

[Paper] 当提示取代视觉时：提示诱导的幻觉在 LVLMs 中

[Paper] GiVA：梯度感知基用于基于向量的适应

[Paper] TingIS：企业规模下从噪声客户事件中实时发现风险事件

[Paper] SpeechParaling-Bench：面向副语言感知的语音生成综合基准