Source

arXiv

4654 posts from this source

排序:

2个月前 · ai · - · -

[Paper] Rudder：使用 LLM 代理在分布式 GNN 训练中引导预取

大规模图神经网络（GNNs）通常通过对顶点的邻居进行固定距离的采样来进行训练。由于大规模输入图是分布式的，...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] FedDAG：聚类联邦学习通过全局数据与梯度集成应对异构环境

联邦学习（Federated Learning，FL）使一组客户端能够在不共享个人数据的情况下协同训练模型，但当客户端数据……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] MediX-R1: 开放式医学强化学习

我们介绍了 MediX‑R1，一个面向医学多模态大语言模型（MLLMs）的开放式强化学习（RL）框架，能够实现临床基础的……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] VGG-T³：离线前馈式大规模3D重建

我们提出了一种可扩展的 3D reconstruction 模型，解决了离线 feed‑forward 方法的一个关键限制：它们的计算和内存需求……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 通过锚定实现模型一致性

大量的研究旨在控制 model disagreement —— 即两个 machine learning models 在 predictions 上的分歧程度。我们采用一种简单且标准的……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] SeeThrough3D：遮挡感知的3D控制在文本到图像生成中

我们将 occlusion reasoning 视为 3D layout‑conditioned generation 的一个基础但被忽视的方面。它对于合成部分遮挡的……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] 传感器泛化用于自适应感知的事件驱动目标检测 via 联合分布训练

受生物启发的事件相机因其异步和低延迟特性最近吸引了大量研究。这些特性提供了高 dy...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] SOTAlign：通过最优传输的单模态视觉和语言模型的半监督对齐

柏拉图表征假设认为，在不同模态上训练的神经网络会趋向于共享的世界统计模型。Rece...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] EvoX：元进化用于自动化发现

最近的工作，例如 AlphaEvolve，已经表明，将 LLM 驱动的优化与进化搜索相结合，可以有效提升程序、提示和算法的性能。

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 规模无法克服语用学：报告偏差对 Vision-Language Reasoning 的影响

在视觉语言模型（VLMs）的推理能力缺乏一直是研究讨论的前沿。我们认为这种行为源于……

#research #paper #ai #nlp #computer-vision
2个月前 · ai · - · -

[Paper] FlashOptim：用于内存高效训练的优化器

标准的 mixed-precision 神经网络训练需要为每个模型参数占用大量 accelerator memory 字节。这些字节不仅反映了参数……

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 从粗糙数据的均值估计：特征描述与高效算法

粗糙数据产生于学习者只能观察到样本的部分信息；即观察到包含样本的集合，而不是其精确数值。这种情况在...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 检索与分割：少量示例足以弥合 Open-Vocabulary Segmentation 中的监督差距吗？

Open-vocabulary segmentation (OVS) 将视觉语言模型 (VLMs) 的零样本识别能力扩展到像素级预测，使得能够对…

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 理解 AI 驱动的科学研究工具的使用与参与度：Asta 交互数据集

AI 驱动的科学研究工具正迅速融入研究工作流，但该领域缺乏对研究人员如何使用这些系统的清晰视角。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 利用 LLMs 进行工业过程自动化

近年来，越来越多的出版物讨论了在软件工程中使用大型语言模型（LLMs）的最佳实践。然而，大多数...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 面向专家投资团队：具备细粒度交易任务的多代理 LLM 系统

大型语言模型（LLMs）的进步加速了自主金融交易系统的发展。虽然主流方法部署多...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] LLM 新手提升在双用途、计算模拟生物学任务中的表现

大型语言模型（LLMs）在生物学基准测试中表现日益出色，但仍不清楚它们是否能提升新手用户——即使人类能够……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] ParamMem：通过参数化反射记忆增强语言代理

Self-reflection 使 language agents 能够迭代地优化解决方案，但往往会产生重复的输出，限制了 reasoning performance。Recent studies ...

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] 广义快速动作价值估计在内存受限环境中

广义快速动作价值估计（GRAVE）已被证明是蒙特卡罗树搜索（MCTS）算法家族中一种强大的变体，适用于……

#Monte Carlo Tree Search #General Game Playing #memory optimization #node recycling #GRAVE algorithm
2个月前 · ai · - · -

[Paper] ThinkOmni：通过 Guidance Decoding 将文本推理提升至 Omni-modal 场景

Omni-modal reasoning 对于智能系统理解并从多样化数据源中进行推断是必不可少的。虽然现有的 omni-modal large language …

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] PRIMA：风险集成的图像-元数据对齐预训练用于基于 LLM 的医学诊断

医学诊断需要有效地综合视觉表现和临床元数据。然而，现有方法往往将元数据视为孤立的任务……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] ManifoldGD：免训练层次流形引导用于基于扩散的数据集蒸馏

近年来，大规模数据集阻碍了高效的模型训练，同时也包含冗余概念。Dataset distillation 旨在合成紧凑的数据集……

#research #paper #ai #machine-learning #computer-vision
2个月前 · ai · - · -

[Paper] SPARTA：可扩展且原则性的树结构多跳问答文本与表格基准

现实世界的表格-文本问答（QA）任务需要模型能够在长文本和源表格之间进行推理，跨越多跳并执行 co...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 为什么 Diffusion Language Models 在真正的并行（非自回归）解码上表现不佳？

扩散语言模型（DLM）常被宣传能够实现并行 token 生成，但实际的快速 DLM 往往会收敛为左到右的自回归模型……

#research #paper #ai #machine-learning #nlp
2个月前 · devops · - · -

[Paper] STELLAR：存储调优引擎利用 LLM 自主推理实现高性能并行文件系统

I/O 性能对数据密集型科学计算的效率至关重要；但调优大规模存储系统既复杂、成本高，而且众所周知地需要大量人力。

#research #paper #devops
2个月前 · ai · - · -

【论文】InnerQ：硬件感知免调优KV缓存量化用于大语言模型

在解码过程中降低大型语言模型（LLMs）的硬件占用对于高效的长序列生成至关重要。一个关键瓶颈是 key-...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 微调不忘记上下文学习：线性注意力模型的理论分析

基于Transformer的大型语言模型展现了上下文学习能力，使其能够通过少样本提示和示例来适应下游任务。在实践中……

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] MTRAG-UN：多轮 RAG 对话中开放挑战的基准

我们提出了 MTRAG-UN，这是一项用于探索多轮检索增强生成（multi-turn retrieval augmented generation）中的开放挑战的基准，后者是大型语言模型的热门应用。我们发布了 …

#research #paper #ai #nlp
2个月前 · software · - · -

[Paper] 基于LLM的深度学习库静默漏洞模糊测试：通过多样化且受控的漏洞转移

深度学习（DL）库被广泛用于关键应用，即使是细微的静默错误也可能导致严重后果。虽然现有的 DL fuzz …

#research #paper #software
2个月前 · ai · - · -

[论文] LLMServingSim 2.0：用于异构和解耦 LLM 服务基础设施的统一模拟器

大型语言模型（LLM）服务基础设施正经历向异构化和解耦的转变。现代部署越来越多地集成了多…

#research #paper #ai #machine-learning
2个月前 · software · - · -

[Paper] 管理基于 LLM 的多智能体系统运行中的不确定性

在诸如寿命超声心动图等安全关键领域应用基于LLM的多代理软件系统会引入无法解决的系统级风险。

#research #paper #software
2个月前 · ai · - · -

[Paper] 关于去个体化神经元：连续对称性实现动态拓扑结构

本文通过利用一种基于对称性原理的新型 primitives 类别——isotropic activation functions，提出了一种用于 dynamic networks 的创新方法。该...

#research #paper #ai #machine-learning
2个月前 · devops · - · -

[Paper] 工作负载浮力：通过识别共享资源瓶颈让 Apps 保持漂浮

现代 multi-tenant、hardware-heterogeneous 计算环境对有效的 workload orchestration 构成了重大挑战。简单的启发式方法用于评估……

#research #paper #devops
2个月前 · software · - · -

[Paper] 混合敏捷团队的生产力与协作：访谈研究

Hybrid work 已成为后疫情时代的现实，正在改变 Agile 团队交付价值、协作和适应的方式。本研究调查混合环境中的……

#research #paper #software
2个月前 · software · - · -

[Paper] RandSet：用于 Fuzzing 种子调度的随机语料库缩减

种子爆炸是模糊测试种子调度中的一个根本性问题，在这种情况下，fuzzer 维护一个庞大的 corpus，却未能挑选出有前景的种子。现有工作 f...

#research #paper #software
2个月前 · software · - · -

[Paper] 视觉语言动作启用机器人变形测试

Vision-Language-Action (VLA) 模型是多模态机器人任务控制器，给定指令和视觉输入后，生成一系列低层控制指令。

#research #paper #software
2个月前 · software · - · -

[Paper] RepoMod-Bench：用于代码仓库现代化的实现无关测试基准

AI 编码代理的演进已经将前沿从简单的代码片段补全转向自主的仓库级工程。然而，评估这些 …

#research #paper #software
2个月前 · ai · - · -

[论文] Neu-PiG：神经预条件网格用于长序列的快速动态表面重建

从非结构化点云数据中对动态3D对象进行时间一致的表面重建仍然具有挑战性，尤其是对于非常长的序列。E...

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[论文] WHOLE：基于世界坐标的手-对象提升来自第一人称视频

Egocentric manipulation videos 在交互过程中由于严重遮挡以及物体频繁进入和离开摄像头视野而极具挑战性……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] Solaris: 在 Minecraft 中构建多人视频世界模型

现有的 action‑conditioned video generation models（video world models）局限于单代理视角，未能捕捉多代理交互……

#research #paper #ai #computer-vision
2个月前 · ai · - · -

[Paper] 在翻译中恢复：高效的基准和数据集自动翻译流水线

多语言大型语言模型（LLM）评估的可靠性目前受到翻译基准质量不一致的影响。现有的...

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] SumTablets：苏美尔泥板的音译数据集

苏美尔文字转写是一种传统系统，用于用拉丁字母表示学者对泥板的解释。多亏了有远见的数字亚述…

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] 现成的 Image-to-Image 模型是击败图像保护方案的全部所需

生成式人工智能（GenAI）的进步促使开发出多种保护策略，以防止图像的未经授权使用。这些方法依赖于...

#research #paper #ai #machine-learning #computer-vision
2个月前 · devops · - · -

[Paper] 混合共识与量子Sybil抗性

Sybil resistance 是去中心化共识协议的关键要求。它通过引入稀缺资源（例如计算能力、moneta……）来实现。

#research #paper #devops
2个月前 · ai · - · -

[Paper] 改进推理语言模型中的参数化知识访问

我们研究如何进行推理，以访问存储在语言模型参数中的世界知识。例如，回忆堪培拉是澳大利亚的首都可能有益……

#research #paper #ai #nlp
2个月前 · ai · - · -

[Paper] GUI‑Libra：训练原生 GUI 代理以推理和行动，采用动作感知监督和部分可验证的 RL

开源原生 GUI 代理在长期导航任务上仍落后于闭源系统。这一差距源于两个限制：高‑q…

#research #paper #ai #machine-learning #nlp
2个月前 · ai · - · -

[Paper] 代理模型用于岩石-流体相互作用：网格尺寸不变方法

建模岩石‑流体相互作用需要求解一组偏微分方程（PDE），以预测流体的流动行为以及流体与岩石的反应。

#research #paper #ai #machine-learning
2个月前 · ai · - · -

[Paper] LiCQA：轻量化复杂问答系统

在过去的二十年里，Question Answering（QA）系统的设计和实现取得了显著进展。然而，针对复杂的…

#research #paper #ai #nlp

Newer posts

Older posts