Source

arXiv

4797 posts from this source

排序:

5个月前 · ai · - · -

[论文] Dyna‑Q 强化学习的预测安全盾

获得强化学习的安全保证是实现其在真实世界任务中可应用性的重大挑战。安全盾牌扩展了标准的强化学习框架，以提供额外的安全保障。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 年龄特异性阿尔茨海默病预测：非均匀时间跨度下的特征约束

阿尔茨海默病是一种导致认知功能下降的衰弱性疾病。及时识别该疾病对于疾病的早期干预和治疗方案的开发至关重要。

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 随机块模型中社区数大于 √n 的相变（II）

网络分析中的一个基本理论问题是确定在什么条件下，社区恢复在随机块模型（Stochastic Block Model）中可以在多项式时间内实现。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] EoS-FM：专家模型集合能作为通用特征提取器吗？

近期在 foundation models 方面的进展在 natural language processing 和 computer vision 等领域显示出巨大前景，类似的努力现在正在…

#ensemble learning #remote sensing #foundation models #computer vision #sustainability
5个月前 · ai · - · -

[Paper] 悲观验证用于开放式数学问题

验证性能的关键限制在于错误检测的能力。基于这一直觉，我们设计了几种悲观验证的变体……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 自适应学习用于抗核抗体图像

抗核抗体（ANA）检测是诊断自身免疫性疾病（包括系统性红斑狼疮、干燥综合征和硬皮病）的关键方法。尽管它的…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 语音、偏见与共指：语音翻译中性别的可解释性研究

Unlike text, speech conveys information about the speaker, such as gender, through acoustic cues like pitch. This gives rise to modality-specific bias concerns.... 不同于文本，语音通过音高等声学线索传递关于说话者的信息，例如性别。这导致了特定模态的偏见问题……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 基于Transformer的时间序列分类的机制可解释性

基于Transformer的模型已成为各种机器学习任务的最新技术工具，包括时间序列分类，但它们的复杂性使得 …

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] IntAttention：全整数注意力流水线用于高效边缘推理

在边缘设备上部署 Transformer 模型受到延迟和能耗预算的限制。虽然 INT8 量化能够有效加速主要的矩阵乘…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Tool‑RoCo：一个 **Agent-as-Tool** 自组织 **Large Language Model** 基准，用于 **Multi‑robot Cooperation**

本研究提出了 **Tool‑RoCo**，这是一种基于 **RoCo**（一个多机器人协作平台）的新基准，用于评估大型语言模型（LLM）在长期多智能体合作中的表现。

#research #paper #ai #machine-learning
5个月前 · software · - · -

[Paper] SV-LIB 1.0：用于软件验证任务的标准交换格式

在过去的二十年里，针对单一语言（例如 C、C++、Java、Rust、Python 等）的验证工具的研发投入了大量的研究与开发工作。这些工具往往专注于特定语言的语义和特性，提供形式化验证、模型检查、符号执行等技术，以帮助发现程序中的错误、漏洞或不符合规范的行为。随着软件系统的规模和复杂性不断提升，跨语言的交互与集成也日益普遍，这促使研究者开始探索能够同时支持多种语言的通用验证框架和工具链，以实现更广泛的代码安全与可靠性保障。

#research #paper #software
5个月前 · ai · - · -

[Paper] 深度伪造检测器的通用设计选择

深度伪造检测方法的有效性往往不太取决于其核心设计，而更取决于实现细节，例如数据预处理、增强……

#deepfake detection #computer vision #benchmarking #model optimization
5个月前 · ai · - · -

[Paper] CanKD：基于跨注意力的非局部操作用于基于特征的知识蒸馏

我们提出了 Cross-Attention-based Non-local Knowledge Distillation (CanKD)，一种利用 cross-attention 的新型基于特征的知识蒸馏框架。

#knowledge distillation #cross-attention #computer vision #model compression #deep learning
5个月前 · ai · - · -

[Paper] 迷失于时间？一种用于时间偏移容忍的生理信号转换的元学习框架

将光电容积描记（PPG）和球体心动描记（BCG）等非侵入性信号转换为临床有意义的信号，如动脉血压……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

合并与界定：对权重的直接操作用于类增量学习

我们提出了一种新颖的训练方法 Merge-and-Bound (M&B)，用于类别增量学习 (CIL)，该方法直接在参数空间中操作模型权重，以实现高效且稳健的增量学习...

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 频率感知的 Token 缩减用于高效 Vision Transformer

Vision Transformers 在各种计算机视觉任务中表现出卓越的性能，但它们相对于 token 的二次计算复杂度……

#vision transformers #token reduction #frequency-aware pruning #computer vision #model efficiency
5个月前 · ai · - · -

[Paper] MobileI2V：在移动设备上实现快速且高分辨率的图像到视频转换

最近，视频生成取得了快速进展，越来越多的关注集中在移动设备上的图像到视频（I2V）合成上。然而，子...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 随声速而行：将 Neural Surrogates 推入高度湍流的跨声速区间

神经代理在汽车空气动力学中的广泛使用，得益于诸如 DrivAerML 和 DrivAerNet++ 等数据集，主要集中在钝体……

#neural surrogates #transonic aerodynamics #CFD dataset #machine learning for fluid dynamics #AB‑UPT
5个月前 · ai · - · -

[Paper] 长文档可读性评估的层次排序神经网络

可读性评估旨在评估文本的阅读难度。近年来，深度学习技术已逐步应用于可读性……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] SpatialBench：对多模态大型语言模型进行空间认知基准测试

空间认知是现实世界多模态智能的基础，使模型能够有效地与物理环境交互。虽然多模态 ...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

Mean-Field Limits for Two-Layer Neural Networks Trained with Consensus-Based Optimization **均值场极限：使用基于共识的优化训练的双层神经网络**

我们研究两层神经网络，并使用一种基于粒子的算法——共识优化（CBO）进行训练。我们比较了 CBO 在……方面的表现。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 数据流中分类器投票线性独立性视角下的集成性能

集成学习通过组合多个基分类器来提升分类性能。虽然增加分类器的数量通常会提升准确率……

#ensemble learning #data streams #linear independence #machine learning research #model sizing
5个月前 · ai · - · -

[Paper] MADRA: 多代理辩论用于风险感知的具身规划

It looks like the text you’d like translated is incomplete. Could you please provide the full passage (including the “> **Source:** …” line at the top) so I can translate it accurately while preserving the required formatting?

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] EvRainDrop: HyperGraph 引导的完成用于有效的帧和事件流聚合

事件相机产生的异步事件流在空间上稀疏，但在时间上密集。主流的 event representation learning algorithms 通常…

#event cameras #hypergraph neural network #multimodal fusion #computer vision #deep learning
5个月前 · ai · - · -

[Paper] 大型语言模型中模型合并技术的系统研究

模型合并将多个 fine-tuned checkpoints 合并为单一模型，无需额外训练，提供了一种重新使用模型并提升效率的有吸引力的方法。

#model merging #large language models #task arithmetic #LLM research #benchmarking
5个月前 · devops · - · -

[论文] MemFine：内存感知细粒度调度用于 MoE 训练

大规模专家混合（Mixture of Experts，MoE）模型的训练面临着由于动态 token 路由导致的严重负载不平衡而产生的关键内存瓶颈。Thi...

#research #paper #devops
5个月前 · ai · - · -

[Paper] 从观察到行动：基于潜在动作的原语分割用于工业环境中的 VLA 预训练

我们提出了一种新颖的无监督框架，用于从连续的工业视频流中解锁海量未标记的人类示范数据，以用于 Vision-Language-Action ...

#unsupervised video segmentation #action primitives #vision-language-action #industrial AI #latent action tokenization
5个月前 · ai · - · -

[Paper] E-M3RF：一种等变多模态3D重新组装框架

3D 重组是一个基本的几何问题，近年来它越来越多地受到深度学习方法的挑战，而不是传统的优化方法。

#equivariant neural networks #multimodal 3D reconstruction #point cloud processing #computer vision
5个月前 · ai · - · -

[论文] SAM 引导的语义与运动变化区域挖掘用于遥感变化标题生成

遥感变化描述是一个新兴且受欢迎的研究任务，旨在用自然语言描述已发生变化的感兴趣内容……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] Odin：面向文本丰富网络表示学习的双模块定向集成

文本属性图需要模型能够有效地将强大的文本理解与结构化推理相结合。现有方法要么依赖 …

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] DiverseVAR：平衡下一尺度视觉自回归模型的多样性与质量

我们引入了 DiverseVAR，一个在测试时提升文本条件视觉自回归模型（VAR）多样性的框架，无需重新训练……

#visual-autoregressive #image generation #diversity #text-to-image #AI research
5个月前 · ai · - · -

[Paper] SUPN: 浅层通用多项式网络

深度神经网络（DNN）和 Kolmogorov‑Arnold 网络（KAN）因其灵活性和表达能力而成为函数逼近的热门方法。然而……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] 在高性能计算基础设施上实现自动化动态 AI 推理伸缩：整合 Kubernetes、Slurm 和 vLLM

由于对人工智能（AI）推理的需求日益增长，尤其是在高等教育领域，利用现有基础设施的新颖解决方案正在出现……

#LLM inference #Kubernetes #Slurm #vLLM #HPC
5个月前 · ai · - · -

[Paper] 主观深度与时间尺度变换器：学习何时何地进行计算

在标准 Transformer（TF）架构中，刚性且统一的计算分配可能限制其效率和可扩展性，尤其是在大规模……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 文本到SQL的双状态推理：整合自适应上下文和渐进生成

最近的分而治之推理方法，尤其是基于思路链（Chain-of-Thought，CoT）的方式，显著提升了 Text-to-SQL 的能力……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] LLM 能否提取类似人类的细粒度证据用于基于证据的事实核查？

误信息经常在在线新闻文章下的用户评论中传播，这凸显了需要有效的方法来检测事实错误的信息。

#LLM #evidence extraction #fact-checking #multilingual dataset #benchmark
5个月前 · ai · - · -

[Paper] 训练内省行为：微调在 7B 模型中诱导可靠的内部状态检测

Lindsey（2025）通过四项实验研究语言模型的内省意识，发现模型有时能够检测并识别注入的……

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[论文] Prune4Web：用于网页代理的 DOM 树剪枝编程

Web 自动化利用智能代理通过模仿人类与网页界面的交互来执行高级任务。尽管最近的 La...

#research #paper #ai #machine-learning #nlp
5个月前 · ai · - · -

[Paper] 推理视觉语言模型在测试时计算上是否呈逆向规模？以干扰项为中心的实证分析

无关信息（即干扰项）如何影响视觉语言模型（VLM）在测试时的尺度扩展？先前对语言模型的研究已经报告了……

#vision-language models #distractor analysis #inverse scaling #prompt engineering #multimodal reasoning
5个月前 · ai · - · -

[Paper] Monet: 在潜在视觉空间中进行超越图像和语言的推理

‘以图像思考’已成为推进视觉推理的有效范式，通过注入视觉证据，超越仅文本的思考链……

#research #paper #ai #machine-learning #computer-vision
5个月前 · software · - · -

[Paper] 大语言模型用于单元测试生成：成就、挑战与前路

单元测试是一种必不可少但又费时的技术，用于验证软件并降低回归风险。虽然经典的自动化方法能够有效地…

#research #paper #software
5个月前 · ai · - · -

[Paper] BanglaASTE：一种用于Bangla电子商务评论中方面-情感-观点抽取的创新框架，采用集成深度学习

Aspect-Based Sentiment Analysis (ABSA) 已成为从用户生成内容中提取细粒度情感洞察的关键工具，尤其是…

#aspect-based sentiment analysis #Bangla NLP #ensemble deep learning #low-resource languages #dataset release
5个月前 · software · - · -

[Paper] 多智能体系统在软件工程数据集适配中的应用：能力、局限性与未来方向

在不同数据集之间自动化适配软件工程（SE）研究制品对于可扩展性和可重复性至关重要，但它仍然是一个庞大的挑战...

#research #paper #software
5个月前 · ai · - · -

[Paper] 自适应与激进拒绝的异常检测用于受污染的训练数据

处理受污染的数据在异常检测中构成了一个关键挑战，因为传统模型假设在纯粹的正常数据上进行训练。传统方法 mi...

#anomaly detection #adaptive rejection #contaminated data #machine learning research #unsupervised learning
5个月前 · ai · - · -

[论文] 控制对注意力 logits 的更改

在训练 transformer 模型时，神经网络权重的稳定性至关重要。查询（query）和键（key）权重尤其成问题，因为它们倾向于增长……

#attention #transformer training #learning rate scaling #model stability #research paper
5个月前 · ai · - · -

[Paper] 使用边界框进行思考：通过强化微调提升时空视频定位

时空视频定位（STVG）需要根据自然语言描述，在未剪辑的视频中同时在时间和空间上定位目标对象。

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 可微分物理-神经模型实现非马尔可夫闭合的学习，以加速粗粒化物理模拟

数值模拟为许多物理和现实世界的问题提供了关键洞见。然而，尽管这些模拟是在完整的3D域上求解的，大多数分析……

#differentiable physics #neural closure #surrogate modeling #non‑Markovian #simulation acceleration
5个月前 · ai · - · -

[Paper] Endo-G$^{2}$T：几何引导 & 时间感知的时间嵌入 4DGS 用于内镜场景

内镜（endo）视频表现出强烈的视角依赖效应，例如 specularities、wet reflections 和 occlusions。纯 photometric supervision 会导致对齐错误……

#4D Gaussian Splatting #endoscopic reconstruction #computer vision #depth estimation #real-time rendering

Newer posts

Older posts