[Paper] Reverso:高效时间序列基础模型用于零样本预测
学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...
学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...
使用 LLM 进行推理正越来越多地在更广泛的验证循环中展开。系统在内部使用廉价检查,例如 self-consistency 或 proxy rewards,wh...
现代离线强化学习(RL)方法能够找到性能良好的actor-critics,然而,使用value-based RL algorithms对这些actor-critics进行在线微调……
虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性,但它们很少区分记忆的文化事实与实际能力之间的差异……
基于LLM的代理在自动化渗透测试方面展现出前景,但报告的性能在不同系统和基准测试中差异很大。我们分析了28个基于LLM的……
强化学习(RL)被广泛用于提升大型语言模型在推理任务上的表现,而异步RL训练具有吸引力,因为它能够提升……
大型语言模型(LLMs)的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……
当前的语音大语言模型在很大程度上执行隐式 ASR:在可以通过转录本解决的任务上,它们在行为上和机制上等同于简单的 WhispertoL……
尽管自主网页代理取得了快速进展,但在人类参与仍然是必不可少的,以在任务展开时塑造偏好并纠正代理行为。Howe...
近期在多模态大型语言模型(MLLMs)方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……
误差界限有损压缩对于管理大规模 HPC 仿真产生的海量数据至关重要。虽然最先进的压缩器…
本文介绍了 KLong,这是一款开源的 LLM 代理,经过训练以解决极长时域任务。其原理是首先通过冷启动模型,利用轨迹……