research — Page 30

排序:

2周前 · ai · - · -

[Paper] Reverso：高效时间序列基础模型用于零样本预测

学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 何时信任廉价检查：弱验证与强验证用于推理

使用 LLM 进行推理正越来越多地在更广泛的验证循环中展开。系统在内部使用廉价检查，例如 self-consistency 或 proxy rewards，wh...

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] SMAC：Score-Matched Actor-Critics 用于稳健的离线到在线迁移

现代离线强化学习（RL）方法能够找到性能良好的actor-critics，然而，使用value-based RL algorithms对这些actor-critics进行在线微调……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 揭示波斯语语言模型中的事实-概念鸿沟

虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性，但它们很少区分记忆的文化事实与实际能力之间的差异……

#research #paper #ai #nlp
2周前 · software · - · -

[Paper] 什么因素决定了用于真实世界渗透测试的优秀 LLM Agent？

基于LLM的代理在自动化渗透测试方面展现出前景，但报告的性能在不同系统和基准测试中差异很大。我们分析了28个基于LLM的……

#research #paper #software
2周前 · ai · - · -

[Paper] 稳定异步：方差控制的离策略强化学习用于LLMs

强化学习（RL）被广泛用于提升大型语言模型在推理任务上的表现，而异步RL训练具有吸引力，因为它能够提升……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[Paper] 面向随时有效的统计水印

大型语言模型（LLMs）的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……

#research #paper #ai #machine-learning
2周前 · ai · - · -

[论文] 级联等价假设：何时语音 LLM 的行为类似于 ASR→LLM 管道？

当前的语音大语言模型在很大程度上执行隐式 ASR：在可以通过转录本解决的任务上，它们在行为上和机制上等同于简单的 WhispertoL……

#research #paper #ai #machine-learning #nlp
2周前 · ai · - · -

[Paper] 在 Web Agents 中建模不同的人类交互

尽管自主网页代理取得了快速进展，但在人类参与仍然是必不可少的，以在任务展开时塑造偏好并纠正代理行为。Howe...

#research #paper #ai #nlp
2周前 · ai · - · -

[Paper] RetouchIQ：MLLM Agents用于基于指令的图像修饰的通用奖励

近期在多模态大型语言模型（MLLMs）方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……

#research #paper #ai #computer-vision
2周前 · devops · - · -

[Paper] TopoSZp：轻量级拓扑感知误差控制压缩用于科学数据

误差界限有损压缩对于管理大规模 HPC 仿真产生的海量数据至关重要。虽然最先进的压缩器…

#research #paper #devops
2周前 · ai · - · -

[Paper] KLong：训练 LLM 代理用于极长时程任务

本文介绍了 KLong，这是一款开源的 LLM 代理，经过训练以解决极长时域任务。其原理是首先通过冷启动模型，利用轨迹……

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts