Source

arXiv

4750 posts from this source

排序:

3个月前 · software · - · -

[Paper] Pharo 中面向仓库级代码补全的包感知方法

Pharo 提供了一个基于语义启发式的高级补全引擎，它在惰性架构中协调特定的 fetcher。这些启发式…

#research #paper #software
3个月前 · devops · - · -

[Paper] 自演化分布式内存架构用于可扩展 AI 系统

分布式 AI 系统在计算、通信和部署层面面临关键的内存管理挑战。基于 RRAM 的内存计算遭受……

#research #paper #devops
3个月前 · ai · - · -

[论文] Mesh4D：单目视频中的4D网格重建与跟踪

我们提出了 Mesh4D，一种用于单目 4D 网格重建的前馈模型。给定一个动态物体的单目视频，我们的模型能够重建该物体的…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] QNeRF：神经辐射场在模拟的基于门的量子计算机上

最近，Quantum Visual Fields（QVFs）在模型紧凑性和收敛速度方面表现出有希望的改进，用于学习提供的2D或3D信号……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] RL-AWB：深度强化学习用于低光夜间场景的自动白平衡校正

夜间颜色恒常性仍然是计算摄影中的一个具有挑战性的问题，因为低光噪声和复杂的照明条件。我们提出了 RL‑A…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] Pixel-Perfect 视觉几何估计

从图像中恢复干净且精确的几何形状对于机器人技术和增强现实至关重要。然而，现有的 geometry foundation models 仍然存在 se...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 在线多校准的最优下界

我们证明了在线多校准的紧致下界，确立了其与边际校准之间的信息论分离。在一般设置下…

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 生成、迁移、适应：从单个人类示例学习 Functional Dexterous Grasping

功能性抓取与灵巧机器人手是实现工具使用和复杂操作的关键能力，但进展受到两个方面的限制……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] GREx：通用指称表达分割、理解与生成

指称表达分割（RES）和指称表达理解（REC）分别对表达式描述的对象进行分割和检测，而指称表达…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] GDPO：组奖励解耦归一化策略优化用于多奖励强化学习优化

随着语言模型的能力日益提升，用户期望它们不仅提供准确的响应，还能表现出符合多样化人类偏好的行为……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] RoboVIP：多视角视频生成与 Visual Identity Prompting 增强机器人操作

多样性、数量和质量的操作数据对于训练有效的机器人策略至关重要。然而，由于硬件和物理设置的限制……

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 稳健推理作为对称保护拓扑相

大型语言模型受到“幻觉”——由语义噪声引起的逻辑不一致——的困扰。我们提出，当前的架构在一个“Metric…”中运行。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 全光场视频生成

相机控制的生成式视频重新渲染方法，例如 ReCamMaster，已经取得了显著进展。然而，尽管它们在单视角…

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[论文] ObjectForesight：从人类视频中预测未来的3D对象轨迹

人类可以轻松预测物体在交互过程中的运动或变化——想象一只杯子被提起、一把刀在切割，或一个盖子被关闭。W...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] 通过 Machine Learning 和 Artificial Intelligence 测量与促进和平

我们使用机器学习和人工智能：1）从新闻和社交媒体中衡量各国的和平水平；2）开发在线工具，以……

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] 学习潜在动作世界模型在真实环境中

能够在现实世界中进行推理和规划的智能体需要具备预测其行为后果的能力。虽然 world models 具备这种…

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 随机深度学习：用于结构化时序数据中不确定性建模的概率框架

我提出一个新颖的框架，将随机微分方程（SDE）与深度生成模型相结合，以改进机器学习中的不确定性量化。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] CAOS：一次性预测器的保形聚合

一次性预测使得仅使用一个标记示例就能快速将 pretrained foundation models 适配到新任务，但缺乏原则性的 uncertainty quantification。

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] MineNPC-Task：面向记忆感知的 Minecraft 代理任务套件

我们提出 textsc{MineNPC-Task}，一个由用户编写的基准和评估工具，用于在开放世界 Minecraft 中测试具备记忆感知、混合主动性的 LLM 代理……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 内部表征作为代理工具选择中幻觉的指标

大型语言模型（LLMs）在工具调用和工具使用方面表现出卓越的能力，但仍会出现幻觉现象，即它们会选择错误的工具……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] FlowLet：使用 Wavelet Flow Matching 的条件 3D 脑 MRI 合成

脑磁共振成像（MRI）在研究神经发育、衰老和疾病方面发挥核心作用。一个关键的应用是大脑年龄预测……

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] MoE3D：一种用于3D重建的Mixture-of-Experts模块

MoE3D 是一种 mixture-of-experts 模块，旨在锐化深度边界并减轻现有 feed-forward 3D … 中的飞点伪影（红色标出）。

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] EARL：面向普适 AI 的液态状态机能耗感知优化

普适人工智能日益依赖于在设备上进行学习的系统，这些系统在严格的资源约束下提供低延迟和能源高效的计算。Liq...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[论文] 使用 Neural Prophet 与深度神经网络进行股票市场价格预测

股票市场价格预测是一个重要的跨学科研究领域，位于金融、统计学和经济学的交叉点。预测...

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 视觉语言模型中提示诱导幻觉的机制

大型视觉语言模型（VLMs）功能强大，但常常因偏向文本提示而非视觉证据而产生幻觉。我们在……中研究了这种失效模式。

#research #paper #ai #machine-learning #nlp #computer-vision
3个月前 · ai · - · -

[Paper] 可解释的数据驱动方法用于优化临床跌倒风险评估

在本研究中，我们旨在更好地将 Johns Hopkins Fall Risk Assessment Tool (JHFRAT) 的跌倒风险预测与额外的临床意义测量对齐……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] LELA：一种基于 LLM 的实体链接方法，具备零样本领域适应

实体链接（将文本中模糊的提及映射到知识库中的实体）是诸如知识图谱构建、问答等任务的基础步骤。

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 降低 AI 研究成本：Task-Aware Compression 如何让 Large Language Model Agents 变得负担得起

当研究人员将 large language models 用于文献审阅或假设生成等自主任务时，计算费用会迅速累积。A...

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] SimuAgent：基于LLM的Simulink建模助手，强化学习增强

大型语言模型（LLMs）已经彻底改变了基于文本的代码自动化，但它们在 graph-oriented engineering workflows 中的潜力仍未得到充分探索……

#research #paper #ai #machine-learning
3个月前 · ai · - · -

[Paper] 大型语言模型自耗式表现循环中的偏差观察与补救

大型语言模型（LLMs）的快速发展引发了对使用合成数据训练未来模型的日益兴趣。然而，这会产生自我‑c...

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] VideoAuto‑R1：一次思考，两次回答的Video Auto Reasoning

链式思考（CoT）推理已成为多模态大型语言模型在视频理解任务中的强大工具。然而，它的必要性和...

#research #paper #ai #computer-vision
3个月前 · ai · - · -

[Paper] CoV：链式视角提示用于空间推理

具身问答（EQA）在3D环境中通常需要收集分布在多个视角且部分被遮挡的上下文。Ho...

#research #paper #ai #machine-learning #computer-vision
3个月前 · ai · - · -

[Paper] 内外：演化以用户为中心的 Core Memory Trees 用于长期个性化对话系统

现有的长期个性化对话系统在调和无限的交互流与有限的上下文约束方面遇到困难，常常因 memory...

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 逆向工程 NLI：自然语言推理的元推理属性研究

自然语言推理（NLI）一直是评估语言模型在自然语言理解方面的重要任务，但其逻辑属性……

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] RelayLLM：通过协作解码实现高效推理

大型语言模型（LLMs）在复杂推理方面常常受到高计算成本和延迟的阻碍，而资源高效的 Small Language Models (SL...

#research #paper #ai #machine-learning #nlp
3个月前 · ai · - · -

[Paper] DocDancer：迈向 Agentic 文档驱动的信息检索

文档问答（DocQA）专注于基于给定文档回答问题，但现有的 DocQA 代理缺乏有效的工具利用和……

#research #paper #ai #nlp
3个月前 · ai · - · -

[Paper] 轻量且可解释的视觉语言框架用于作物病害视觉问答

针对作物病害分析的 Visual Question Answering 需要准确的视觉理解和可靠的语言生成。本工作提出了一种轻量级的 vi...

#research #paper #ai #nlp #computer-vision
3个月前 · devops · - · -

[Paper] Nalar：智能体服务框架

LLM 驱动的 agentic 应用程序正日益自动化复杂的多步骤任务，但由于组件异构，如何高效地为其提供服务仍然是一个挑战。

#research #paper #devops
3个月前 · ai · - · -

[Paper] ECLIPSE：用于科学工程中仪器原型设计的进化计算库

设计科学仪器通常需要在大型且高度受约束的设计空间中进行探索，并使用计算成本高的物理仿真。这些...

#research #paper #ai
3个月前 · ai · - · -

[Paper] 高级多模态学习用于癫痫发作检测与预测：概念、挑战与未来方向

癫痫是一种慢性神经系统疾病，以反复的非诱发性发作为特征，影响全球超过5000万人，并带来显著风险……

#research #paper #ai
3个月前 · ai · - · -

[Paper] 高级多模态学习用于癫痫发作检测与预测：概念、挑战与未来方向

癫痫是一种慢性神经系统疾病，以反复的无诱因发作为特征，影响全球超过5000万人，并带来显著的风险……

#research #paper #ai
3个月前 · devops · - · -

[Paper] 带有拜占庭聚合器的异步安全联邦学习

隐私保护的联邦平均是保护联邦学习中客户端隐私的核心方法。本文中，我们研究了在异步…

#research #paper #devops
3个月前 · software · - · -

[Paper] AVX / NEON 内在函数：何时应使用它们？

提出了一项跨配置基准测试，以在通用开发项目的背景下探索 AVX / NEON 内在函数的能力和局限性。

#research #paper #software
3个月前 · devops · - · -

[Paper] 并行二次 Selected Inversion 在量子输运模拟中的应用

在摩尔定律的驱动下，晶体管的尺寸已被压缩到纳米尺度。需要先进的量子输运（QT）求解器来准确……

#research #paper #devops
3个月前 · ai · - · -

[Paper] 分析 AI 编码代理撰写的 Pull Request 中的消息-代码不一致

由 AI 编码代理生成的 Pull request（PR）描述是向人工审阅者传达代码更改的主要渠道。然而，alignment b...

#research #paper #ai #machine-learning
3个月前 · software · - · -

[Paper] Untappd 中游戏化的纵向分析：对社交饮酒应用的伦理反思

本文对 Untappd 进行了一项纵向伦理分析。Untappd 是一款社交饮酒应用，通过徽章（badges）、连胜（streaks）以及社交功能将啤酒消费游戏化。

#research #paper #software
3个月前 · devops · - · -

[Paper] Proof of Commitment：以人为中心的资源用于Permissionless Consensus

无许可共识协议需要一种稀缺资源来调节领袖选举并提供 Sybil 抵抗。现有范式如 Proof of Work …

#research #paper #devops
3个月前 · ai · - · -

[Paper] 神经-符号集成与可进化策略

Neural-Symbolic (NeSy) 人工智能已经成为一种有前景的方法，用于将神经网络的学习能力与可解释性相结合。

#research #paper #ai #machine-learning

Newer posts

Older posts