[Paper] 这是什么语言?问问你的 Tokenizer
Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分,它有助于语料库策划、训练…
3122 posts from this source
Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分,它有助于语料库策划、训练…
我们提出了一种两阶段的 “Mine and Refine” 对比训练框架,用于语义文本嵌入,以提升多类别电子商务搜索检索。Larg...
人类可以从二维 visual inputs 中推断出物体的 three-dimensional 结构。对这种能力的建模一直是科学界的长期目标。
随着人类在高风险决策中日益依赖多轮对话 AI,亟需原则性框架来确保此类交互能够可靠地实现……
Black-box 对抗攻击在大型视觉语言模型(LVLMs)上具有挑战性,因为缺少梯度且多模态边界复杂。虽然先前的研究…
市场区域模型,例如 Huff 模型及其扩展,广泛用于估计零售和服务地点的区域市场份额和客户流动。
从复杂场景中检索用户指定的对象仍然是一项具有挑战性的任务,尤其是当查询含糊不清或涉及多个相似对象时。Exi...
学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...
使用 LLM 进行推理正越来越多地在更广泛的验证循环中展开。系统在内部使用廉价检查,例如 self-consistency 或 proxy rewards,wh...
现代离线强化学习(RL)方法能够找到性能良好的actor-critics,然而,使用value-based RL algorithms对这些actor-critics进行在线微调……
虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性,但它们很少区分记忆的文化事实与实际能力之间的差异……
基于LLM的代理在自动化渗透测试方面展现出前景,但报告的性能在不同系统和基准测试中差异很大。我们分析了28个基于LLM的……
强化学习(RL)被广泛用于提升大型语言模型在推理任务上的表现,而异步RL训练具有吸引力,因为它能够提升……
大型语言模型(LLMs)的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……
当前的语音大语言模型在很大程度上执行隐式 ASR:在可以通过转录本解决的任务上,它们在行为上和机制上等同于简单的 WhispertoL……
尽管自主网页代理取得了快速进展,但在人类参与仍然是必不可少的,以在任务展开时塑造偏好并纠正代理行为。Howe...
近期在多模态大型语言模型(MLLMs)方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……
误差界限有损压缩对于管理大规模 HPC 仿真产生的海量数据至关重要。虽然最先进的压缩器…
本文介绍了 KLong,这是一款开源的 LLM 代理,经过训练以解决极长时域任务。其原理是首先通过冷启动模型,利用轨迹……
Instruction-following language models 被训练为有帮助且安全,但它们的安全行为在良性微调下可能会恶化,并且在 ad...
我们研究匿名 n 节点网络中的 self-stabilizing leader election 问题。实现 low space memory complexity 的 self-stabilization 是特别的……
自然语言处理(NLP)工具支持需求工程(RE)任务,例如需求获取、分类和验证。然而,它们……
自适应系统越来越多地与人类密切互动,常常共享相同的物理或虚拟环境,并在做决策时与 e...
量子计算因其有潜力解决超出经典计算机能力的计算问题而受到广泛关注。随着……