Source

arXiv

4658 posts from this source

排序:

2个月前 · ai · - · -

[Paper] 这是什么语言？问问你的 Tokenizer

Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分，它有助于语料库策划、训练…

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 挖掘与细化：优化电子商务搜索检索中的分级相关性

我们提出了一种两阶段的 “Mine and Refine” 对比训练框架，用于语义文本嵌入，以提升多类别电子商务搜索检索。Larg...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

人类水平的 3D 形状感知源于多视图学习

人类可以从二维 visual inputs 中推断出物体的 three-dimensional 结构。对这种能力的建模一直是科学界的长期目标。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 多轮人机协作与用户指定需求

随着人类在高风险决策中日益依赖多轮对话 AI，亟需原则性框架来确保此类交互能够可靠地实现……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 通过细粒度细节定位推动黑盒 LVLM 攻击的前沿

Black-box 对抗攻击在大型视觉语言模型（LVLMs）上具有挑战性，因为缺少梯度且多模态边界复杂。虽然先前的研究…

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · software · - · -

[Paper] huff：用于市场区域分析的 Python 包

市场区域模型，例如 Huff 模型及其扩展，广泛用于估计零售和服务地点的区域市场份额和客户流动。

#research #paper #software
2个月前 · ai · - · -

[Paper] IntRec：基于意图的检索与对比式细化

从复杂场景中检索用户指定的对象仍然是一项具有挑战性的任务，尤其是当查询含糊不清或涉及多个相似对象时。Exi...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Reverso：高效时间序列基础模型用于零样本预测

学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 何时信任廉价检查：弱验证与强验证用于推理

使用 LLM 进行推理正越来越多地在更广泛的验证循环中展开。系统在内部使用廉价检查，例如 self-consistency 或 proxy rewards，wh...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SMAC：Score-Matched Actor-Critics 用于稳健的离线到在线迁移

现代离线强化学习（RL）方法能够找到性能良好的actor-critics，然而，使用value-based RL algorithms对这些actor-critics进行在线微调……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 揭示波斯语语言模型中的事实-概念鸿沟

虽然新兴的 Persian NLP 基准已经扩展到语用学和礼貌性，但它们很少区分记忆的文化事实与实际能力之间的差异……

#research #paper #ai #nlp
2个月前 · software · - · -

[Paper] 什么因素决定了用于真实世界渗透测试的优秀 LLM Agent？

基于LLM的代理在自动化渗透测试方面展现出前景，但报告的性能在不同系统和基准测试中差异很大。我们分析了28个基于LLM的……

#research #paper #software
2个月前 · ai · - · -

[Paper] 稳定异步：方差控制的离策略强化学习用于LLMs

强化学习（RL）被广泛用于提升大型语言模型在推理任务上的表现，而异步RL训练具有吸引力，因为它能够提升……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 面向随时有效的统计水印

大型语言模型（LLMs）的激增需要有效的机制来区分机器生成的内容和人类文本。虽然统计……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 级联等价假设：何时语音 LLM 的行为类似于 ASR→LLM 管道？

当前的语音大语言模型在很大程度上执行隐式 ASR：在可以通过转录本解决的任务上，它们在行为上和机制上等同于简单的 WhispertoL……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 在 Web Agents 中建模不同的人类交互

尽管自主网页代理取得了快速进展，但在人类参与仍然是必不可少的，以在任务展开时塑造偏好并纠正代理行为。Howe...

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] RetouchIQ：MLLM Agents用于基于指令的图像修饰的通用奖励

近期在多模态大型语言模型（MLLMs）方面的进展显示出将视觉语言推理扩展到专业工具化图像的巨大潜力……

#research #paper #ai #computer-vision
2个月前 · devops · - · -

[Paper] TopoSZp：轻量级拓扑感知误差控制压缩用于科学数据

误差界限有损压缩对于管理大规模 HPC 仿真产生的海量数据至关重要。虽然最先进的压缩器…

#research #paper #devops
2个月前 · ai · - · -

[Paper] KLong：训练 LLM 代理用于极长时程任务

本文介绍了 KLong，这是一款开源的 LLM 代理，经过训练以解决极长时域任务。其原理是首先通过冷启动模型，利用轨迹……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 学会保持安全：在微调过程中针对安全退化的自适应正则化

Instruction-following language models 被训练为有帮助且安全，但它们的安全行为在良性微调下可能会恶化，并且在 ad...

#research #paper #ai #machine-learning #nlp
2个月前 · devops · - · -

[Paper] Informative Trains：一种内存高效的自稳定领袖选举算法在匿名图中的实现

我们研究匿名 n 节点网络中的 self-stabilizing leader election 问题。实现 low space memory complexity 的 self-stabilization 是特别的……

#research #paper #devops
2个月前 · software · - · -

[Paper] 面向需求工程中自然语言处理工具的软件参考架构

自然语言处理（NLP）工具支持需求工程（RE）任务，例如需求获取、分类和验证。然而，它们……

#research #paper #software
2个月前 · software · - · -

自适应系统中伦理的运行时维度

自适应系统越来越多地与人类密切互动，常常共享相同的物理或虚拟环境，并在做决策时与 e...

#research #paper #software
2个月前 · software · - · -

[Paper] 量子软件社区的社会技术福祉：社区异味概述

量子计算因其有潜力解决超出经典计算机能力的计算问题而受到广泛关注。随着……

#research #paper #software
2个月前 · devops · - · -

[Paper] 可视化洞察：普适流处理服务的代理式优化

在靠近数据源处处理传感数据，通常涉及 Edge 设备，能够为智能城市等普遍应用提供低延迟。这种常见的……

#research #paper #devops
2个月前 · devops · - · -

[论文] Trivance：通过捷径化 Multiport Networks 实现延迟最优 AllReduce

AllReduce 是分布式计算中的一种基础集合操作，也是大规模训练和推理的关键性能瓶颈。它的完成…

#research #paper #devops
2个月前 · software · - · -

[Paper] 支持 HTML 优先的 Web 开发的理由

自90年代初推出以来，网络已成为全球最大的应用平台。超文本标记语言（HTML）一直是……

#research #paper #software
2个月前 · ai · - · -

[Paper] 大语言模型在长上下文代码问答中的鲁棒性与推理保真度

大型语言模型（LLMs）日益在需要对长代码上下文进行推理的软件工程任务中提供帮助，但它们在不同…的鲁棒性仍然是一个问题。

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 量化开源软件项目之间的竞争关系

纵观软件史，演进一直在竞争驱动的兴衰循环中进行，开源软件（OSS）也不例外。Thi...

#research #paper #software
2个月前 · ai · - · -

[Paper] 在噪声监督下的学习受反馈-真相差距支配

当反馈被吸收的速度快于任务结构的评估速度时，学习者会倾向于相信反馈而不是事实。一个双时间尺度模型展示了这种反馈‑真相的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] TeCoNeRV：利用时间一致性实现可压缩的视频神经表示

隐式神经表示（INRs）最近在视频压缩方面展示了令人印象深刻的性能。然而，由于必须对每个 INR 进行过拟合以...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 知识嵌入的潜在投影用于鲁棒表征学习

latent space models 被广泛用于分析高维离散数据矩阵，例如电子健康记录（EHR）中的 patient-feature 矩阵，……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 安全代理系统的策略编译器

基于LLM的代理正日益在需要复杂授权策略的场景中部署：客户服务协议、审批工作流、数据访问……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 学习类人机器人末端执行器控制用于开放词汇视觉运动操作

在野外使用类人机器人对任意物体进行视觉定位操作，需要精确的末端执行器（EE）控制以及对……的可推广理解。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 强化 Fast Weights 与 Next-Sequence Prediction

Fast weight architectures 通过保持 constant memory overhead，为 long-context modeling 提供了相较于 attention-based transformers 的有前景的替代方案。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 测量2025年中期LLM辅助对生物学新手表现的影响

大型语言模型（LLMs）在生物学基准测试中表现出色，这引发了它们可能帮助新手获取双用途实验室技能的担忧。Ye...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 显著性感知多路径思考：重新审视视觉-语言推理

Vision-language models (VLMs) 旨在通过联合利用视觉和文本模态进行推理。虽然分配额外的 inference-time computation 已被证明……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 在 Machine Unlearning 中保护未删除的

机器去学习旨在从已训练模型中删除特定数据点，通常力求模拟“完美再训练”，即生成模型会…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 无参数表征在下游基准上超越单细胞基础模型

单细胞RNA测序 (scRNA-seq) 数据表现出强大且可重复的统计结构。这激发了大规模基础模型的开发……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 基于合成的多重检验与FDR控制

多重假设检验与错误发现率（FDR）控制是统计推断中的一个基本问题，广泛应用于基因组学、药物...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

Object-Centric 表示在 Compositional Generalization 上更好吗？

Compositional generalization（组合泛化），即对熟悉概念的新组合进行推理的能力，是人类认知的基础，也是一个关键挑战…

#object-centric representations #compositional generalization #visual question answering #benchmark #representation learning
2个月前 · ai · - · -

[Paper] 关于公平 k-Center 问题近似难度的研究

在本工作中，我们研究公平 k-center 问题的近似难度。这里数据点被划分为若干组，任务是选择一个 …

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 扩展 Open Discrete Audio Foundation Models 的规模：交错的语义、声学和文本标记

当前的音频语言模型主要以文本为先，要么扩展预训练的文本 LLM 主干，要么依赖仅语义的音频 token，限制了 g...

#research #paper #ai #nlp
2个月前 · ai · - · -

【论文】Retrieval-Augmented Foundation Models 用于 Matched Molecular Pair Transformations，以重现 Medicinal Chemistry Intuition

Matched molecular pairs (MMPs) 捕捉了药物化学家在设计类似物时常规使用的局部化学编辑，但现有的机器学习方法要么…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 在真实世界中学习情境感知

人类感知的核心方面是 situated awareness，即将自身与周围物理环境联系起来并对可能的行动进行推理的能力……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] VETime：视觉增强零样本时间序列异常检测

时间序列异常检测（TSAD）需要识别即时的 Point Anomalies 和长期的 Context Anomalies。然而，现有的 foundation models f...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 邻域稳定性作为最近邻搜索性的度量

基于聚类的近似最近邻搜索（ANNS）将一组点组织成若干分区，并仅搜索其中少数分区以找到最近邻……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SPARC：场景规划与推理用于自动化 C 单元测试生成

对于 C 语言而言，Automated unit test generation 仍然是一个巨大的挑战，因为 high-level program intent 与 rigid syntactic constraint 之间存在 semantic gap……

#research #paper #ai #machine-learning

Newer posts

Older posts