[Paper] 这是什么语言?问问你的 Tokenizer
Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分,它有助于语料库策划、训练…
4658 posts from this source
Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分,它有助于语料库策划、训练…
我们提出了一种两阶段的 “Mine and Refine” 对比训练框架,用于语义文本嵌入,以提升多类别电子商务搜索检索。Larg...
人类可以从二维 visual inputs 中推断出物体的 three-dimensional 结构。对这种能力的建模一直是科学界的长期目标。
随着人类在高风险决策中日益依赖多轮对话 AI,亟需原则性框架来确保此类交互能够可靠地实现……
Black-box 对抗攻击在大型视觉语言模型(LVLMs)上具有挑战性,因为缺少梯度且多模态边界复杂。虽然先前的研究…
市场区域模型,例如 Huff 模型及其扩展,广泛用于估计零售和服务地点的区域市场份额和客户流动。
从复杂场景中检索用户指定的对象仍然是一项具有挑战性的任务,尤其是当查询含糊不清或涉及多个相似对象时。Exi...
学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...
使用 LLM 进行推理正越来越多地在更广泛的验证循环中展开。系统在内部使用廉价检查,例如 self-consistency 或 proxy rewards,wh...
现代离线强化学习(RL)方法能够找到性能良好的actor-critics,然而,使用value-based RL algorithms对这些actor-critics进行在线微调……
虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性,但它们很少区分记忆的文化事实与实际能力之间的差异……
基于LLM的代理在自动化渗透测试方面展现出前景,但报告的性能在不同系统和基准测试中差异很大。我们分析了28个基于LLM的……
强化学习(RL)被广泛用于提升大型语言模型在推理任务上的表现,而异步RL训练具有吸引力,因为它能够提升……
大型语言模型(LLMs)的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……
当前的语音大语言模型在很大程度上执行隐式 ASR:在可以通过转录本解决的任务上,它们在行为上和机制上等同于简单的 WhispertoL……
尽管自主网页代理取得了快速进展,但在人类参与仍然是必不可少的,以在任务展开时塑造偏好并纠正代理行为。Howe...
近期在多模态大型语言模型(MLLMs)方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……
误差界限有损压缩对于管理大规模 HPC 仿真产生的海量数据至关重要。虽然最先进的压缩器…
本文介绍了 KLong,这是一款开源的 LLM 代理,经过训练以解决极长时域任务。其原理是首先通过冷启动模型,利用轨迹……
Instruction-following language models 被训练为有帮助且安全,但它们的安全行为在良性微调下可能会恶化,并且在 ad...
我们研究匿名 n 节点网络中的 self-stabilizing leader election 问题。实现 low space memory complexity 的 self-stabilization 是特别的……
自然语言处理(NLP)工具支持需求工程(RE)任务,例如需求获取、分类和验证。然而,它们……
自适应系统越来越多地与人类密切互动,常常共享相同的物理或虚拟环境,并在做决策时与 e...
量子计算因其有潜力解决超出经典计算机能力的计算问题而受到广泛关注。随着……
在靠近数据源处处理传感数据,通常涉及 Edge 设备,能够为智能城市等普遍应用提供低延迟。这种常见的……
AllReduce 是分布式计算中的一种基础集合操作,也是大规模训练和推理的关键性能瓶颈。它的完成…
自90年代初推出以来,网络已成为全球最大的应用平台。超文本标记语言(HTML)一直是……
大型语言模型(LLMs)日益在需要对长代码上下文进行推理的软件工程任务中提供帮助,但它们在不同…的鲁棒性仍然是一个问题。
纵观软件史,演进一直在竞争驱动的兴衰循环中进行,开源软件(OSS)也不例外。Thi...
当反馈被吸收的速度快于任务结构的评估速度时,学习者会倾向于相信反馈而不是事实。一个双时间尺度模型展示了这种反馈‑真相的……
隐式神经表示(INRs)最近在视频压缩方面展示了令人印象深刻的性能。然而,由于必须对每个 INR 进行过拟合以...
latent space models 被广泛用于分析高维离散数据矩阵,例如电子健康记录(EHR)中的 patient-feature 矩阵,……
基于LLM的代理正日益在需要复杂授权策略的场景中部署:客户服务协议、审批工作流、数据访问……
在野外使用类人机器人对任意物体进行视觉定位操作,需要精确的末端执行器(EE)控制以及对……的可推广理解。
Fast weight architectures 通过保持 constant memory overhead,为 long-context modeling 提供了相较于 attention-based transformers 的有前景的替代方案。
大型语言模型(LLMs)在生物学基准测试中表现出色,这引发了它们可能帮助新手获取双用途实验室技能的担忧。Ye...
Vision-language models (VLMs) 旨在通过联合利用视觉和文本模态进行推理。虽然分配额外的 inference-time computation 已被证明……
机器去学习旨在从已训练模型中删除特定数据点,通常力求模拟“完美再训练”,即生成模型会…
单细胞RNA测序 (scRNA-seq) 数据表现出强大且可重复的统计结构。这激发了大规模基础模型的开发……
多重假设检验与错误发现率(FDR)控制是统计推断中的一个基本问题,广泛应用于基因组学、药物...
Compositional generalization(组合泛化),即对熟悉概念的新组合进行推理的能力,是人类认知的基础,也是一个关键挑战…
在本工作中,我们研究公平 k-center 问题的近似难度。这里数据点被划分为若干组,任务是选择一个 …
当前的音频语言模型主要以文本为先,要么扩展预训练的文本 LLM 主干,要么依赖仅语义的音频 token,限制了 g...
Matched molecular pairs (MMPs) 捕捉了药物化学家在设计类似物时常规使用的局部化学编辑,但现有的机器学习方法要么…
人类感知的核心方面是 situated awareness,即将自身与周围物理环境联系起来并对可能的行动进行推理的能力……
时间序列异常检测(TSAD)需要识别即时的 Point Anomalies 和长期的 Context Anomalies。然而,现有的 foundation models f...
基于聚类的近似最近邻搜索(ANNS)将一组点组织成若干分区,并仅搜索其中少数分区以找到最近邻……
对于 C 语言而言,Automated unit test generation 仍然是一个巨大的挑战,因为 high-level program intent 与 rigid syntactic constraint 之间存在 semantic gap……