Source

arXiv

4646 posts from this source

排序:

1个月前 · ai · - · -

[Paper] VTAM：Video‑Tactile‑Action 模型用于超越 VLAs 的复杂物理交互

Video-Action Models（VAMs）已成为具身智能的有前景框架，通过从原始视频流中学习隐式世界动态来生成 t...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] InverFill：一步逆转用于增强少步扩散修补

近期 diffusion-based 模型在 image inpainting 中实现了 photorealism，但需要大量 sampling steps，限制了实际使用。Few-step text-to-image 模型的……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] 端到端高效强化学习用于线性 Bellman 完备的确定性转移 MDP

我们研究在满足线性 Bellman 完备性的马尔可夫决策过程（MDPs）中使用线性函数逼近的强化学习（RL）——一个基础…

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] CSTS：面向 AI 原生网络检测的规范安全遥测基底

AI驱动的网络安全系统在跨环境部署时常因碎片化的、以事件为中心的遥测表示而失败。我们介绍了Canon……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] SNARE：一种针对理性玩家在5f+1模型中解决拜占庭共识的陷阱

TRAP 协议通过将可追责共识与一次性 BFTCR 最终化阶段相结合，解决了理性一致性问题。我们提出了 SNARE（Scalable Nash Agreeme...）。

#research #paper #devops
1个月前 · software · - · -

[Paper] MuSe：用于 Remix IDE 的变异测试插件

Mutation testing 是一种通过向程序中引入人工故障来评估测试套件有效性的技术。虽然 Mutation testing 插件是……

#research #paper #software
1个月前 · ai · - · -

[Paper] 针对性对抗流量生成：黑盒方法规避物联网网络中的入侵检测系统

将机器学习（ML）算法集成到物联网（IoT）应用中，已经带来了显著的优势，同时也引入了漏洞 t...

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 相似度感知 Mixture-of-Experts 用于数据高效持续学习

机器学习模型在部署后常常需要适应新的数据，因为现实世界的结构化或非结构化动态。持续学习（Continual Learning，CL）框架……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SortedRL：通过在线长度感知调度加速 LLM 的 RL 训练

规模化强化学习（RL）已显示出在提升大型语言模型（LLMs）推理能力方面的强大潜力，尤其是在需要……的任务中。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 通过文本表示引导的推理，释放多模态大型语言模型的空间推理能力

现有的多模态大语言模型（MLLMs）在 3D 空间推理方面存在困难，因为它们未能构建 3D 环境的结构化抽象……

#research #paper #ai #nlp #computer-vision
1个月前 · ai · - · -

[Paper] 图能匹配：传输对齐的基于能量的建模用于图生成

用于离散域（如图）的 Energy-based models 明确捕获相对似然，自然能够实现可组合的 probabilistic inference 任务……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 空间与时序数据库的自然语言接口：方法、分类与未来方向的综合概述

构建面向数据库的自然语言接口（NLIDB）的任务，最近在数据库领域和自然语言处理领域都受到了广泛关注。

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 大语言模型的离策略基于价值的强化学习

提高数据利用效率对于在生成轨迹成本高昂的长期任务中扩展强化学习（RL）至关重要。如何……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] WISTERIA：基于弱隐式信号的注意力时间关系抽取

Temporal Relation Extraction (TRE) 需要识别两个事件或时间表达式在时间上的关系。现有的基于注意力的模型通常高亮……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 引导 LLMs 进行文化本地化生成

LLMs 在全球部署，但其响应倾向于拥有丰富训练数据的文化。现有的文化本地化方法，如 prompti...

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] LLM 奥林匹克：为何模型评估需要封闭考试

Benchmarks 和 leaderboards 是 NLP 最常用来传达进展的方式，但在 LLM 时代，它们越来越容易被误读。分数可能反映 benchmark……

#research #paper #ai #machine-learning #nlp
1个月前 · software · - · -

[Paper] 重新思考 Self-Sovereign Identity 原则：面向参与者的需求分类

集中式身份管理系统持续面临安全和隐私挑战，促使人们探索去中心化身份（Decentralized Identity，DI）和 S...

#research #paper #software
1个月前 · software · - · -

[Paper] 语言模型能通过软件测试认证考试吗？案例研究

大型语言模型（LLMs）在学术研究和更广泛的社会应用中发挥着关键作用。LLMs 正日益被用于软件测试……

#research #paper #software
1个月前 · software · - · -

[Paper] Q-GARS：量子启发式鲁棒微服务链式调度

Microservice-based applications 的特征是由 long-tail execution patterns 和 heterogeneous resource constraints 引起的 stochastic latencies。

#research #paper #software
1个月前 · software · - · -

[论文] 实时深度强化学习系统的容错设计与多目标模型检查

深度强化学习（DRL）已成为解决复杂决策问题的强大范式。然而，基于DRL的系统仍面临显著……

#research #paper #software
1个月前 · ai · - · -

[Paper] LLM 能检测微服务基础设施模式的实例吗？

架构模式经常出现在各种软件制品中。模式及其实现的种类繁多，使得检测变得具有挑战性……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] PCR：一种预取增强的缓存复用系统，用于低延迟 RAG 服务

检索增强生成（Retrieval-Augmented Generation，RAG）系统通过加入补充检索到的文档，提升大语言模型（LLMs）的性能，...

#research #paper #devops
1个月前 · ai · - · -

[Paper] 持久结构记忆中的坐标系统问题（神经架构）

我们介绍了双视角信息素路径网络（Dual-View Pheromone Pathway Network，DPPN），这是一种通过持久的信息素场在潜在槽上路由稀疏注意力的架构……

#research #paper #ai #machine-learning
1个月前 · devops · - · -

[Paper] 面向紧耦合 MPI 工作负载的 Rank-Aware 资源调度（Kubernetes）

完全配置的消息传递接口（MPI）并行实现了计算流体力学（CFD）求解器的近乎最优的实际运行时间。本文工作…

#research #paper #devops
1个月前 · devops · - · -

[Paper] 交互式与紧急 HPC：研究现状

当我们思考自己如何使用智能手机、电子商务、协作平台、LLM 等时，我们与计算机的大多数交互都是交互式的，并且常常促使……

#research #paper #devops
1个月前 · devops · - · -

[Paper] 通信高效近似梯度编码

大规模分布式学习的目标是最小化一个损失函数 L，该函数依赖于训练数据集，并相对于一个 d 维参数向量进行优化。分布式…

#research #paper #devops
1个月前 · ai · - · -

【论文】Hebbian Attractor Networks 用于机器人运动

生物神经网络在其一生中持续适应并根据经验自行修改——这种能力在人工系统中基本缺失。

#research #paper #ai
1个月前 · devops · - · -

论文：Linux 与高性能计算

在20世纪80年代，高性能计算（HPC）成为开放（非国防）科学与工程研究社区的另一种研究工具。然而，...

#research #paper #devops
1个月前 · ai · - · -

[Paper] WorldCache：内容感知缓存用于加速视频世界模型

Diffusion Transformers (DiTs) 为高保真视频世界模型提供动力，但由于顺序去噪和昂贵的时空计算，仍然计算成本高……

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] VideoDetective：通过外部查询和内在相关性进行线索搜索，以实现长视频理解

由于上下文窗口有限，长视频理解对多模态大语言模型（MLLMs）仍然具有挑战性，这需要识别稀疏的 q…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] 端到端训练用于统一标记化和潜在去噪

潜在扩散模型（LDMs）通过在学习到的潜在空间中操作，实现高保真合成。然而，训练最先进的 LDMs 需要复杂的 st...

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] UniMotion：用于 Motion-Text-Vision 理解与生成的统一框架

我们提出 UniMotion，据我们所知，这是第一个能够同时理解和生成人体动作、自然语言和 RGB 图像的统一框架。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] ThinkJEPA：通过大规模视觉语言推理模型赋能潜在世界模型

最近在潜在世界模型（例如 V-JEPA2）方面的进展显示出在从视频观测中预测未来世界状态的有希望的能力。然而，...

#research #paper #ai #machine-learning #nlp #computer-vision
1个月前 · ai · - · -

[Paper] DualCoT-VLA：视觉-语言 Chain of Thought via 并行推理 for Vision-Language-Action Models

Vision-Language-Action (VLA) 模型将视觉观测和语言指令直接映射到机器人动作。虽然在简单任务上有效，标准 VL...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] Vision-Language Models 中空间推理的双重机制

许多多模态任务，例如图像字幕生成和视觉问答，需要视觉语言模型（VLMs）将对象与其属性关联……

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] DoRA 的扩展：通过分解范数和融合内核实现高秩适应

Weight-Decomposed Low-Rank Adaptation (DoRA) 通过将权重的大小与方向解耦来扩展 LoRA，但其前向传播需要计算 W + … 的逐行范数。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] 重新利用几何基础模型进行多视图扩散

虽然最近在 generative latent spaces 方面的进展推动了 single-image generation 的显著进展，但用于 novel view synthesis 的最佳 latent space ...

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] DUO-VSR: 双流蒸馏用于一步视频超分辨率

基于扩散的 video super-resolution（VSR）最近实现了显著的保真度，但仍然受到高昂采样成本的限制。虽然 distribution mat…

#research #paper #ai #computer-vision
1个月前 · ai · - · -

[Paper] TiCo：时间可控训练用于语音对话模型

我们提出 TiCo，这是一种简单的后训练方法，用于使口语对话模型（SDMs）能够遵循时间约束指令并生成具有……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] 更高的可及性可能会放大 generative AI 中的歧视

数以亿计的人依赖大型语言模型（LLMs）进行教育、工作，甚至医疗。然而，这些模型已知会复制并放大……

#research #paper #ai #nlp
1个月前 · devops · - · -

[Paper] exaCB：可复现的持续基准集合大规模，利用增量方法

高性能计算（HPC）系统日益增长的异构性以及向 exascale 架构的转变需要系统化且可重复的……

#research #paper #devops
1个月前 · ai · - · -

[Paper] 基于置信度的解码在扩散语言模型中可证明高效

扩散语言模型（DLM）已成为语言建模中一种有前景的自回归（AR）模型的替代方案，能够实现灵活的生成顺序……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] MemDLM：内存增强 DLM 训练

扩散语言模型（DLMs）相较于自回归（AR）模型提供了诸多吸引人的优势，例如全注意力并行解码和灵活生成……

#research #paper #ai #nlp
1个月前 · ai · - · -

[Paper] ShapDBM：探索 Shapley 空间中的决策边界图

Decision Boundary Maps（DBMs）是可视化机器学习分类边界的有效工具。然而，DBM 的质量在很大程度上取决于维度……

#research #paper #ai #machine-learning
1个月前 · ai · - · -

单模型，双市场：出价感知生成式推荐

使用语义 ID 的生成式推荐系统，例如 TIGER（Rajput et al., 2023），已成为在序列推荐中被广泛采用的竞争范式。

#research #paper #ai #machine-learning
1个月前 · ai · - · -

[Paper] SpatialReward：可验证的空间奖励建模用于文本到图像生成中的细粒度空间一致性

近期通过强化学习 (RL) 的文本到图像 (T2I) 生成的最新进展受益于评估语义对齐和视觉质量的奖励模型。

#research #paper #ai #machine-learning #computer-vision
1个月前 · ai · - · -

[Paper] Dyadic：可扩展平台用于人类-人类和人类-AI 对话研究

对话在社会生活中无处不在，但对这一互动过程的实证研究一直受到工具不足以模块化且不……

#research #paper #ai #machine-learning #nlp
1个月前 · ai · - · -

[Paper] Gumbel 蒸馏用于并行文本生成

自回归（AR）语言模型的慢速、顺序特性推动了并行解码方法的采用。然而，这些非 AR 模型往往牺…

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts