· ai · - · -
[Paper] 揭示波斯语语言模型中的事实-概念鸿沟
虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性,但它们很少区分记忆的文化事实与实际能力之间的差异……
虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性,但它们很少区分记忆的文化事实与实际能力之间的差异……
基于LLM的代理在自动化渗透测试方面展现出前景,但报告的性能在不同系统和基准测试中差异很大。我们分析了28个基于LLM的……
强化学习(RL)被广泛用于提升大型语言模型在推理任务上的表现,而异步RL训练具有吸引力,因为它能够提升……
大型语言模型(LLMs)的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……
当前的语音大语言模型在很大程度上执行隐式 ASR:在可以通过转录本解决的任务上,它们在行为上和机制上等同于简单的 WhispertoL……
尽管自主网页代理取得了快速进展,但在人类参与仍然是必不可少的,以在任务展开时塑造偏好并纠正代理行为。Howe...
近期在多模态大型语言模型(MLLMs)方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……
误差界限有损压缩对于管理大规模 HPC 仿真产生的海量数据至关重要。虽然最先进的压缩器…
本文介绍了 KLong,这是一款开源的 LLM 代理,经过训练以解决极长时域任务。其原理是首先通过冷启动模型,利用轨迹……
Instruction-following language models 被训练为有帮助且安全,但它们的安全行为在良性微调下可能会恶化,并且在 ad...
我们研究匿名 n 节点网络中的 self-stabilizing leader election 问题。实现 low space memory complexity 的 self-stabilization 是特别的……
自然语言处理(NLP)工具支持需求工程(RE)任务,例如需求获取、分类和验证。然而,它们……