Source

arXiv

4654 posts from this source

排序:

2个月前 · ai · - · -

[Paper] 学习与命名具有卓越生存特征的子群

在许多应用中，识别生存时间比总体更长或更短的子群体非常重要。例如，在医学领域，……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 混合放大倍率聚合用于计算病理学的可推广区域级表征

近年来，出现了一种标准的计算病理工作流程，将 whole slide images 裁剪成 tiles，这些 tiles 使用一个 foun...

#research #paper #ai #computer-vision
2个月前 · devops · - · -

[Paper] LLMTailor：一种层级式定制工具，用于大语言模型的高效检查点

Checkpointing 对于在训练大型语言模型（LLMs）时实现容错至关重要。然而，现有方法无论其 I/O 策略如何，周期性……

#research #paper #devops
2个月前 · ai · - · -

[Paper] 流神经网络：无epoch学习与持久时间状态

大多数当代神经学习系统依赖于基于 epoch 的优化和对历史数据的重复访问，隐含地假设计算是可逆的。我...

#research #paper #ai
2个月前 · ai · - · -

[Paper] 可证明的最后迭代收敛：多目标安全 LLM 对齐的 Optimistic Primal-Dual

人类反馈强化学习（RLHF）在使大型语言模型（LLMs）符合人类偏好方面发挥了重要作用。虽然RLHF与实验…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 当 AI 写作时，谁的声音仍在？量化大型语言模型中对 World English Varieties 的文化标记抹除

大型语言模型（LLMs）正日益被用于“专业化”职场沟通，但往往以牺牲语言身份为代价。我们引入“Cultu…”。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] NoLan：通过动态抑制语言先验缓解大型视觉语言模型中的对象幻觉

对象幻觉是大型视觉语言模型（LVLMs）的一个关键问题，模型的输出可能包含输入图像中不存在的对象。一个自然…

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

[Paper] MedTri：用于结构化医学报告标准化以提升视觉-语言预训练的平台

医学视觉语言预训练越来越依赖医学报告作为大规模监督信号；然而，原始报告往往表现出显著的 st...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] WeaveTime：将早期帧流入 VideoLLMs 的涌现记忆

最近在 Multimodal Large Language Models 方面的进展大幅提升了视觉理解和推理能力，然而它们的 quadratic attention 和 offline training …

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] SigmaQuant: 硬件感知的异构量化方法用于边缘 DNN 推理

Deep neural networks (DNNs) 对于在边缘或移动设备上执行高级任务至关重要，但它们的部署常常受到严重资源限制的阻碍。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 含均值漂移污染的鲁棒均值估计的样本复杂度界

我们研究在均值偏移污染存在的情况下的均值估计基本任务。在 mean-shift contamination 模型中，对手被允许替换…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] IndicIFEval：用于在 14 种印地语系语言中进行可验证指令遵循评估的基准

Instruction-following benchmarks 仍然主要以 English‑centric 为主，导致对数以亿计的 Indic language speakers 存在关键的 evaluation gap。

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] SWE‑Protégé：学习有选择地与专家合作解锁小型语言模型作为软件工程代理

Small language models（SLMs）在成本、延迟和适应性方面具有显著优势，但在长时程软件任务上仍落后于更大的模型。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 使用 String Method 探测 Diffusion Models 的几何

理解学习到的分布的几何结构对于改进和解释扩散模型至关重要，然而系统性的工具用于探索它们的…

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] PASTA：面向加速器的模块化程序分析工具框架

现代计算系统中硬件加速器的日益增长的复杂性和多样性，需要灵活、低开销的程序分析工具。我们提出了 PA...

#research #paper #devops
2个月前 · software · - · -

[Paper] 混合开发环境中的可视化里程碑规划

本文使用 agile 词汇解释 Visual Milestone Planning (VMP) 方法，以促进 agile 从业者将其作为 … 的 front end。

#research #paper #software
2个月前 · devops · - · -

[Paper] IOAgent：通过 LLMs 实现可信 HPC I/O 性能诊断能力的民主化

随着 HPC 存储栈的复杂性快速增长，领域科学家在有效利用 HPC 存储系统以实现 t... 方面面临日益增长的挑战。

#research #paper #devops
2个月前 · ai · - · -

[Paper] 门诊预约调度优化的遗传算法方法

在多中心医疗环境中，复杂的医疗预约调度优化仍然是一个重要的运营挑战，其中临床…

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] JSAM：隐私拖延容错联合客户端选择与激励机制设计在差分隐私联邦学习中

差分隐私联邦学习面临一个根本性的张力：保护客户端数据的隐私机制同时会产生可量化的…

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 从重构到稳定化：使用大语言模型进行迭代代码可读性重构的大规模实验

大型语言模型（LLMs）正日益被用于自动代码重构任务。虽然这些模型能够快速进行代码重构，但其质量可能表现出……

#research #paper #software
2个月前 · ai · - · -

[Paper] 神经路由求解器综述

利用深度学习来解决车辆路径问题的神经路由求解器（NRSs）已展示出在实际应用中的显著潜力。通过 …

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] Proto-ML：用于 ML 解决方案原型设计的 IDE

原型设计在机器学习（ML）解决方案的开发中发挥关键作用，然而现有工具往往在有效协作方面提供的支持有限……

#research #paper #software
2个月前 · devops · - · -

[Paper] Lamport的时间之箭：逻辑时钟中的范畴错误

Lamport 在 1978 年的论文中引入了 happens-before 关系和逻辑时钟，使分布式系统摆脱了对同步物理时钟的依赖。Thi...

#research #paper #devops
2个月前 · devops · - · -

[Paper] 面向编排式编程的基于类型的非干涉强制

编排从全局视角描述分布式协议，使得能够通过构造正确性合成局部行为。我们开发了一种基于策略参数的…

#research #paper #devops
2个月前 · ai · - · -

[Paper] 测试时训练结合 KV 绑定实际上是线性注意力

Test-time training (TTT) 与 KV 绑定作为序列建模层通常被解释为一种在线元学习形式，它记忆键值映射……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] Squint：用于Sim-to-Real机器人的快速视觉强化学习

视觉强化学习在机器人领域很有吸引力，但成本高——off-policy 方法样本效率高，却速度慢；on-policy 方法并行化效果好，但...

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 任意模态中的多向量索引压缩

我们研究在任何模态下用于后期交互的高效多向量检索。后期交互已成为信息检索中的主导范式……

#research #paper #ai #nlp #computer-vision
2个月前 · ai · - · -

[Paper] 从试错中学习：面向 Embodied LLMs 的反思式测试时规划

Embodied LLMs 为机器人赋予高级任务推理能力，但它们无法反思出错的原因或原因，从而使部署变成一系列独立的……

#research #paper #ai #machine-learning #nlp #computer-vision
2个月前 · ai · - · -

[Paper] Untied Ulysses：内存高效上下文并行 via Headwise Chunking

高效处理 Transformer 模型中的长序列通常需要通过上下文并行将计算拆分到多个加速器上。The domin...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 冷冻电子断层成像中膜的感兴趣区域分割与形态学分析

冷冻电子断层成像（cryo-ET）能够实现对生物结构的高分辨率三维重建，包括膜和膜蛋白……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 关于数据工程以扩展 LLM 终端能力

尽管在 terminal capabilities 方面，大型语言模型最近取得了快速进展，但支撑 state-of-the-art terminal agents 的 training data strategies 仍然……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 统计查询下界用于平滑不可知学习

我们研究最近由~cite{CKKMS24} 引入的 smoothed agnostic learning 的复杂性，其中学习者与目标中的最佳 classifier 竞争……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[论文] 为什么 Pass@k 优化会削弱 Pass@1：LLM 后训练中的 Prompt 干扰

Pass@k 是一种广泛使用的可验证大语言模型任务的性能指标，包括数学推理、代码生成和简答推理等。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 单张图像生成具备3D姿态和视角控制的人体视频

最近的扩散方法由于其强大的视觉生成能力，在从单张图像生成视频方面取得了显著进展。然而，c...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

【论文】Spa3R：预测空间场建模用于3D视觉推理

虽然视觉语言模型（VLMs）在二维视觉理解方面表现出色，但它们对三维空间的理解和推理能力——空间的基石——……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Diffusion Duality, Chapter II: $Ψ$-Samplers 与高效课程

Uniform-state discrete diffusion models 在少步生成和引导方面表现出色，因为它们具备自我纠正的能力，使其相较于 autoregressive 模型更受青睐。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] Mask-HybridGNet：基于图的分割从像素级监督中获得自发的解剖对应关系

基于图的医学图像分割使用边界图来表示解剖结构，提供固定拓扑的标记点和固有的人口层面…

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] XMorph：可解释的脑肿瘤分析通过 LLM 辅助的混合深度智能

深度学习显著推动了自动化脑肿瘤诊断的发展，但临床采用仍受限于可解释性和计算约束……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 透过文字：使用语言模型控制视觉检索质量

文本到图像检索是视觉语言学习中的基础任务，但在真实场景中，它常常受到用户查询简短且信息不足的挑战。

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 高效层次化任意角度路径规划在多分辨率3D网格上

层次化、多分辨率体积映射方法被广泛用于表示大规模和复杂的环境，因为它们能够高效捕获它们的 o...

#path-planning #any-angle #multi-resolution #robotics #ROS
2个月前 · ai · - · -

[Paper] NoRD：一种数据高效的视觉-语言-动作模型，可在无需推理的情况下驾驶

视觉-语言-动作（VLA）模型正通过用统一的端到端架构取代模块化流水线，推动自动驾驶的发展。然而，当前的 VLA……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 时序临床数据的序列反事实推断：解决时间旅行者困境

反事实推断使临床医生能够对患者结果提出“如果…会怎样”的问题，但标准方法假设特征独立性和同步……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] PVminer：一种领域特定工具，用于检测患者生成数据中的患者声音

患者生成的文本，如安全消息、调查和访谈，包含了丰富的患者声音（PV）表达，反映了交流行为……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 不仅是多少，而是哪里：将 Epistemic Uncertainty 分解为每类贡献

在安全关键的分类中，失败的代价往往是不对称的，然而贝叶斯深度学习仅用一个标量 μ 来概括认知不确定性。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SELAUR：自我进化 LLM 代理通过不确定性感知奖励

大型语言模型（LLMs）正日益被部署为多步骤决策代理，其中有效的奖励设计对于引导学习至关重要。Al...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 在多GPU上使用张量并行扩展状态空间模型

选择性状态空间模型（SSMs）已迅速成为大语言模型的有力骨干，尤其适用于长上下文工作负载。然而在部署…

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] ReviveMoE：大规模 MoE LLM 推理部署中的硬件故障快速恢复

随着 LLM 部署在更多硬件上扩展，系统中单点故障的概率显著增加，云运营商必须考虑稳健的c...

#research #paper #devops
2个月前 · ai · - · -

[Paper] Prompt-Level 蒸馏：一种非参数的模型微调替代方案，用于高效推理

高级推理通常需要 Chain-of-Thought 提示，这种方法准确，但会导致不可接受的延迟以及巨大的测试时推理成本。Th...

#research #paper #ai #nlp

Newer posts

Older posts