Source

arXiv

4796 posts from this source

排序:

4个月前 · ai · - · -

[Paper] DentalGPT: 激励牙科中的多模态复杂推理

对牙科中的多模态数据进行可靠的解释对于自动化口腔健康护理至关重要，然而当前的多模态大语言模型（MLLMs）仍面临困难……

#research #paper #ai #machine-learning #nlp #computer-vision
4个月前 · ai · - · -

[Paper] HFS：整体查询感知帧选择用于高效视频推理

在视频理解中，关键帧选择面临重大挑战。传统的 top‑K 选择方法会独立对帧进行打分，往往会失败于……

#research #paper #ai #nlp #computer-vision
4个月前 · ai · - · -

[Paper] Parallax：运行时并行化用于异构边缘系统的算子回退

对边缘设备上实时 DNN 应用的需求日益增长，需要更快地推理日益复杂的模型。虽然许多设备包括 sp...

#research #paper #ai #machine-learning #computer-vision
4个月前 · software · - · -

【论文】Mini-SFC：用于服务功能链编排与管理的综合仿真框架

在不断演进的云计算和网络环境中，服务功能链（SFC）在实现复杂服务方面发挥着关键作用。

#research #paper #software
4个月前 · devops · - · -

[Paper] 增强剪枝用于多包消息传递下的分布式接近中心性

使用 closeness centrality 识别中心节点是分析大规模复杂网络的关键任务，但其去中心化计算仍然是 cha...

#research #paper #devops
4个月前 · ai · - · -

[Paper] 幻觉更少是否意味着创造力更低？对LLMs的实证研究

大型语言模型（LLMs）在自然语言理解和推理方面展现出卓越的能力，但却存在幻觉问题：生成的 f...

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] 面向隐私保护的代码生成：差分隐私代码语言模型

专注于代码的大型语言模型（CodeLLM）在生成代码片段、文档和测试用例方面展示了卓越的能力。Howe...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 学习进化并通过 Neural Unrolling 实现收敛保证

从手工设计的启发式方法向数据驱动的进化算法转变面临一个根本性的两难困境：在实现神经可塑性的同时不牺牲 …

#research #paper #ai
4个月前 · ai · - · -

[Paper] REMODEL-LLM：使用 LLM 将 C 代码转换为 Java

将 C 代码自动翻译成 Java 代码是一项臭名昭著的困难任务，充满了源于根本范式转变（过程式 ...）的挑战。

#research #paper #ai #machine-learning
4个月前 · software · - · -

[Paper] AutoFSM：一种用于 FSM 代码生成、IR 与基于 SystemC 测试的多代理框架

随着大语言模型（LLMs）在代码生成方面的快速发展，它们在硬件设计中的应用正受到越来越多的关注。然而，e...

#research #paper #software
4个月前 · software · - · -

[Paper] CIS 基准扫描结果的可视化

在本文中，我们介绍了 GraphSecure，这是一款提供安全扫描结果高级分析和可视化的 Web 应用程序。GraphSecure 使用户……

#research #paper #software
4个月前 · devops · - · -

[Paper] RollMux：相位级多路复用用于去聚合的RL后训练

Rollout-training 解耦正逐渐成为强化学习（Reinforcement Learning，RL）后训练的标准架构，其中内存受限的 rollout 和 compute-b…

#research #paper #devops
4个月前 · software · - · -

[Paper] 覆盖不足：SBFL 驱动的对手动创建与自动生成测试的洞察

测试阶段是软件开发的关键环节，但手动创建测试用例可能耗时。因此，对……的需求日益增长。

#research #paper #software
4个月前 · ai · - · -

[Paper] GPU本地编译的理论基础：快速代码迭代

当前的 AI 代码生成系统在编译、执行和测试阶段由于 CPU 与 GPU 之间的数据传输而遭受显著的延迟瓶颈……

#research #paper #ai #machine-learning
4个月前 · devops · - · -

[Paper] 基于 LLVM 的 SPDZ 优化流水线

主动安全算术 MPC 现在已可用于实际应用，但性能和可用性仍受限于框架特定的编译栈，……

#research #paper #devops
4个月前 · ai · - · -

[Paper] StereoSpace：在规范空间中通过端到端扩散实现深度无关的立体几何合成

我们介绍了 StereoSpace，一个基于 diffusion 的 monocular-to-stereo 合成框架，它仅通过 viewpoint conditioning 来建模几何，而无需 …

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] WorldLens：真实世界中驾驶世界模型的全谱评估

生成式世界模型正在重塑具身 AI，使代理能够合成看起来逼真的 4D 驾驶环境，但往往在物理上失败……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 通过立体和中层视觉赋能动态城市导航

在语言和视觉领域基础模型的成功激励了对全端到端机器人导航基础模型（NFMs）的研究。NFMs 直接映射单目……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] Omni-Attribute：开放词汇属性编码器用于视觉概念个性化

视觉概念个性化旨在将特定的图像属性（如身份、表情、光照和风格）转移到未见过的场景中。然而……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] SceneMaker：开放集 3D 场景生成，解耦去遮挡与姿态估计模型

我们在本工作中提出了一个名为 SceneMaker 的解耦 3D 场景生成框架。由于缺乏足够的 open-set de-occlusion 和 pose estimation 先验……

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 双向 Normalizing Flow：从数据到噪声再返回

归一化流（Normalizing Flows，NFs）已被确立为生成建模的原则性框架。标准的 NFs 包含前向过程和逆向过程……

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] Group Diffusion: 通过解锁跨样本协作提升图像生成

在本工作中，我们探索了扩散模型推理中未被利用的信号。虽然所有先前的方法在推理时都是独立生成图像的，但我们则提出……

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 高质量数据共享的层次化数据集选择

现代机器学习的成功依赖于获取高质量的训练数据。在许多实际场景中，例如从公共仓库获取数据……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] E-RayZer：自监督 3D 重建作为空间视觉预训练

自监督预训练已经彻底改变了语言、单幅2D图像和视频的foundation models，但在学习3D方面仍基本未被探索。

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[Paper] 我们准备好在文本到3D生成中使用RL了吗？一次渐进式调查

Reinforcement learning (RL)，此前已被证明在大型语言模型和多模态模型中有效，已成功扩展用于提升二维图像生成……

#research #paper #ai #machine-learning #nlp #computer-vision
4个月前 · ai · - · -

[Paper] ClusIR: 面向聚类引导的全能图像恢复

All-in-One Image Restoration (AiOIR) 旨在在统一框架下从多种退化中恢复高质量图像。然而，现有方法常常 f...

#research #paper #ai #computer-vision
4个月前 · ai · - · -

[论文] ImplicitRDP：端到端视觉‑力扩散策略，结构化慢快学习

人类水平的接触丰富操作依赖于两种关键模态的不同角色：视觉提供空间丰富但时间上较慢的全局上下文，...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] AlcheMinT: 细粒度时间控制用于多参考一致视频生成

近期，基于大型扩散模型的以主题为驱动的视频生成取得了重要进展，使得能够在用户提供的主题条件下进行个性化内容合成……

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] Mull-Tokens: 模态无关潜在思考

推理超越语言；现实世界需要对空间、时间、affordances，以及远超文字所能表达的诸多方面进行推理。现有的 multimo...

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] OmniView：全视扩散模型用于 3D 和 4D 视图合成

先前将相机控制注入扩散模型的方法主要聚焦于 4D 一致性任务的特定子集：新视角合成、文本到视频…

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 更强的无归一化Transformer

尽管归一化层长期被视为深度学习架构中不可或缺的组成部分，最近引入的 Dynamic Tanh (DyT) 已经……

#research #paper #ai #machine-learning #nlp #computer-vision
4个月前 · ai · - · -

[Paper] 关于决策代理与高阶因果过程

我们在部分可观测马尔可夫决策过程（POMDP）中的决策代理与单输入过程函数之间建立了精确的对应关系，...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 实证评估 Frank-Wolfe 方法用于构建白盒对抗攻击

为神经网络构建对抗性攻击似乎是其在各种服务中部署的关键挑战。为了估计对抗…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] Any4D：统一前馈度量4D重建

我们提出了 Any4D，一种可扩展的多视角 Transformer，用于度量尺度的密集前馈 4D 重建。Any4D 直接生成每像素的运动和几何……

#research #paper #ai #machine-learning #computer-vision
4个月前 · ai · - · -

[Paper] 基于课程的强化学习在未知弯曲管状通道中的自主无人机导航

在受限的管状环境中进行自主无人机导航仍然是一个重大挑战，因为管道的约束几何形状以及墙壁的接近……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 异步推理：免训练交互式思考 LLMs

许多最先进的 LLM 被训练成在给出答案之前先思考。推理可以大幅提升语言模型的能力和安全性，但它也会……

#research #paper #ai #machine-learning #nlp
4个月前 · ai · - · -

[Paper] 噪声量子学习理论

我们开发了一个用于从噪声量子实验中学习的框架，重点关注容错设备通过噪声耦合访问未表征系统……

#research #paper #ai #machine-learning
4个月前 · ai · - · -

【论文】解耦的 Q-Chunking

Temporal-difference (TD) 方法通过从自身的未来价值预测进行 bootstrapping，高效地学习 state 和 action values，但这种 self‑bootstrappi…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] CompanionCast：面向社交共观体验的多代理对话 AI 框架，支持空间音频

社交存在是共同观看内容时享受的核心，但现代媒体消费正日益趋向于孤立。我们调查是否多代理…

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 多模态 LLMs 的计算情感分析：关于新兴方法机会的最新证据

情感是政治的核心，分析情感在政治传播中的作用有着悠久的传统。随着研究越来越多地利用 audio-visual 材料……

#research #paper #ai #nlp
4个月前 · ai · - · -

[Paper] 量化托尔金《霍比特人》中的情感基调：对话情感分析，使用 RegEx、NRC-VAD 和 Python

本研究使用计算文本分析方法，分析 J. R. R. Tolkien 的《霍比特人》（1937）中对话的情感基调。对话通过正则表达式提取……

#research #paper #ai #nlp
4个月前 · ai · - · -

[论文] 离散扩散语言模型的尺度行为

现代 LLM 预训练消耗大量计算资源和训练数据，这使得不同模型的 scaling behavior（或 scaling laws）成为关键的区分因素。

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 基于黑箱损坏的生成建模：自洽随机插值

Transport-based methods 已成为从大规模、干净的数据集构建 generative models 的主流范式。然而，在许多科学和工程…

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 贝叶斯符号回归 via 后验采样

Symbolic regression 是一种强大的工具，可直接从数据中发现控制方程，但其对噪声的敏感性阻碍了其更广泛的应用。Thi...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 在多智能体环境中学习可控且多样的玩家行为

本文提出了一种强化学习框架，使得在不依赖人类游戏数据的情况下实现可控且多样的玩家行为。现有的...

#research #paper #ai #machine-learning
4个月前 · ai · - · -

[Paper] 关于 LogSumExp 平滑近似最优性的简明证明

我们考虑在无穷范数下，对 (mathbb{R}^d) 中的（逐坐标）最大函数进行平滑化的设计。LogSumExp 函数 (f(x)=ln!left(sum_{i=1}^{d} exp(x_i)right)) ……

#research #paper #ai #machine-learning
4个月前 · software · - · -

[Paper] Zorya：自动化 Concolic 执行单线程 Go 二进制文件

Go 在关键基础设施中的采用加剧了对系统化漏洞检测的需求，但现有的 symbolic execution 工具在处理 Go 二进制文件时仍面临困难。

#research #paper #software
4个月前 · ai · - · -

[Paper] LabelFusion：学习融合 LLMs 和 Transformer 分类器以实现稳健的文本分类

LabelFusion 是一种用于文本分类的融合集成模型，它学习将传统的基于 transformer 的分类器（例如 RoBERTa）与一个或多个 Larg...

#research #paper #ai #machine-learning #nlp

Newer posts

Older posts