[Paper] 动态定价下的锚点-恢复让步用于LLM增强的货运谈判
发布: (2026年4月23日 GMT+8 00:17)
8 分钟阅读
原文: arXiv
Source: arXiv - 2604.20732v1
概览
本文针对货运经纪平台的一个现实痛点——在快速变化、动态定价的市场中协商承运人费率——提出了解决方案。传统的让步模型使用静态的 “β” 参数,无法跟上对话中途的价格变动;而大型语言模型(LLMs)虽然提供了灵活性,却带来了延迟、非确定性以及安全风险。作者引入了一种 双索引 “锚点‑恢复” 框架,该框架能够将让步曲线实时适配市场价差 并且 保证报价永不倒退,同时保持定价逻辑的确定性,仅将自然语言翻译的工作交给 LLM。
关键贡献
- 基于价差的自适应 β: 直接从当前价格差距中推导让步形状参数,自动根据谈判情境调节激进程度。
- 锚定并恢复机制: 即使在对话中途目标价格被修改,也能保证出价单调(不下降),消除以往公式中的“价格回撤”错误。
- 确定性定价核心: 所有价格计算均由闭式公式完成;大语言模型仅用于在人类可读语言与公式输入/输出之间进行转换。
- 可扩展评估: 在 115 k 场真实谈判中测试,显示相较于固定‑β 基线和一个 200 亿参数的大语言模型经纪人,能够实现相当或更好的经纪人节省和达成率。
- 对随机载体的鲁棒性: 在与引入随机性的 LLM‑驱动的承运人代理进行谈判时,仍能保持更高的达成率和节省。
方法论
- 边际‑价差映射 – 对于每个货运,系统计算 价差(承运人成本与经纪人目标之间的差额)。该价差输入一个简单函数,输出针对当前市场紧张程度(紧、适中、宽松)定制的 β 值。
- 让步公式 – 使用自适应 β,经纪人的报价遵循经典的随时间变化的让步曲线(例如指数衰减),决定价格向目标靠拢的速度。
- 锚定‑恢复逻辑
- 锚定: 当出现定价变动(例如目标上调)时,当前报价被“锚定”为新的基准。
- 恢复: 之后的让步相对于该锚定值计算,确保后续报价永不低于锚定价格。
- LLM 集成(可选) – LLM 接收确定性的报价并生成面向承运人的自然语言信息(如“我们可以以每英里 $X 的价格接受”)。逆向翻译(承运人的文字回复 → 数值意图)同样由 LLM 处理,但核心价格永不经过模型。
- 实验设置 – 作者回放了 115 125 条历史谈判记录,比较了以下几种方案:
- 固定‑β 基线(静态让步曲线)
- 提出的自适应‑β + 锚定‑恢复系统
- 完整的 LLM 经纪人(20 B 参数)
- 由 LLM 驱动的模拟随机承运人代理
Results & Findings
| 指标 | Fixed‑β Baseline | Adaptive‑β + Anchor‑Resume | 20B‑Parameter LLM Broker |
|---|---|---|---|
| Broker Savings (vs. optimal) | Up to 3 % loss in wide spreads | Matches or exceeds baseline (up to 2 % better) | Similar savings |
| Agreement Rate | 78 % (narrow), 65 % (wide) | 81 % (narrow), 68 % (wide) | 80 % (narrow), 67 % (wide) |
| Latency per negotiation | < 5 ms (pure formula) | < 5 ms (formula) + optional LLM translation (~30 ms) | ~200 ms (full LLM inference) |
| Scalability | Linear, cheap | Linear, cheap | Limited by GPU inference cost |
- Regime‑aware behavior: 在紧张的价差下,adaptive β 促使经纪人快速让步,提升负载覆盖率;在宽松的价差下则保持克制,保留利润空间。
- Monotonicity guarantee: 没有任何谈判出现价格“回退”,从而消除运营商常见的挫败感。
- Cost efficiency: 通过将大量计算工作保留在确定性公式中,系统能够以极低的云计算成本处理数千个并发聊天。
实际意义
- 对于货运平台: 部署轻量级定价引擎,能够在市场波动时即时响应,而无需庞大的 LLM 推理开销。
- 对于构建谈判机器人 的开发者: 将 决策逻辑(确定性数学)与 沟通层(LLM 生成的文本)分离,以实现透明性和对话的精致度。
- 成本节约: 大幅降低推理支出——从数百毫秒、GPU 密集型的 LLM 调用,转为亚毫秒级的 CPU 计算。
- 合规性与可审计性: 确定性公式为定价决策提供清晰的审计轨迹,简化监管报告和内部治理。
- 可扩展性: anchor‑and‑resume 模式可应用于任何动态定价场景(例如,网约车的 surge 定价、广告出价谈判),在交互过程中目标值会发生变化。
限制与未来工作
- 依赖准确的价差估计: 自适应 β 假设价差被正确测量;噪声成本数据可能导致让步激进性调校错误。
- LLM 翻译质量: 虽然定价核心是确定性的,但自然语言层仍继承 LLM 的怪癖(例如偶尔的措辞错误或提示注入漏洞)。
- 实时市场冲击: 突然的、极端的价格飙升可能需要超出锚定‑恢复逻辑的额外保护措施(例如硬上限)。
- 未来方向:
- 将强化学习引入,以根据实时谈判结果微调 β 更新。
- 探索混合模型,即轻量化、领域特定的 LLM 在边缘案例推理中提供帮助,而核心保持公式化。
- 将框架扩展到多方谈判(例如经纪人‑承运人‑托运人三方)以及其他物流垂直领域。
作者
- Hoang Nguyen
- Lu Wang
- Marta Gaia Bras
论文信息
- arXiv ID: 2604.20732v1
- 类别: cs.MA, cs.AI, cs.CL
- 发表时间: 2026年4月22日
- PDF: Download PDF