Source

arXiv

4797 posts from this source

排序:

5个月前 · ai · - · -

[Paper] 不确定性量化用于视觉对象姿态估计

量化对象姿态估计的不确定性对于稳健的控制和规划至关重要。尽管姿态估计是一个研究成熟的机器人问题……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[论文] 注意力引导的 Patch-Wise 稀疏对抗攻击在 Vision-Language-Action 模型上

近年来，具身智能中的 Vision-Language-Action（VLA）模型发展迅速。然而，现有的 adversarial attack 方法需要高成本……

#adversarial attacks #vision-language models #embodied AI #feature-space perturbation #multimodal robustness
5个月前 · ai · - · -

[论文] Multi-Crit：在多元标准遵循上的多模态评审基准

大型多模态模型（LMM）因其强大的指令遵循能力和一致性，正日益被用作多模态评估系统中的评审者。本文提出 Multi-Crit 基准，用于测试 LMM 能否充当可靠的评审...

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[论文] AI/ML 模型卡在 Edge AI 网络基础设施中：迈向 Agentic AI

AI/ML 模型卡可以包含针对 AI/ML 模型与预期用途的基准评估，但在模型训练期间进行的一次性评估并不能……

#model cards #edge AI #model context protocol #dynamic evaluation #AI governance
5个月前 · ai · - · -

【论文】EvilGenie：奖励劫持基准

我们介绍 EvilGenie，一个用于编程环境中 reward hacking 的基准。我们从 LiveCodeBench 获取问题，并创建一个环境，使得 agents …

#reward hacking #code generation #benchmark #LLM evaluation #AI safety
5个月前 · ai · - · -

[Paper] CaFlow：提升长期动作质量评估的 Causal Counterfactual Flow

动作质量评估（AQA）从动作视频中预测细粒度的执行分数，已广泛应用于体育、康复和技能评估……

#action-quality-assessment #causal-inference #video-analysis #computer-vision #long-term-temporal-modeling
5个月前 · ai · - · -

[Paper] 低资源设备上的持续错误纠正

AI模型在日常设备中的广泛应用凸显了一个关键挑战：预测错误会降低用户体验。虽然现有的解决方案……

#continual learning #edge AI #few-shot correction #prototype classifier #mobile AI
5个月前 · ai · - · -

[Paper] 使用迭代 PPO 对齐 LLM 以实现多轮对话结果

优化大型语言模型（LLMs）以实现多轮对话结果仍然是一个重大挑战，尤其是在像 AI mar... 这样的目标导向设置中。

#LLM #reinforcement learning #PPO #RLHF #goal-oriented dialogue
5个月前 · ai · - · -

[Paper] 弥合不可避免的先验：比较因果建模框架

AI/ML模型已迅速崭露头角，作为解决先前未解决问题的创新，其放大人类偏见的意外后果……

#causal inference #system dynamics #probabilistic modeling #python library #research
5个月前 · ai · - · -

[Paper] 视觉Transformer中非单调缩放机制

更深的视觉Transformer往往表现不如较浅的模型，这挑战了常见的尺度假设。通过对ViT-...的系统性实证分析，...

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] Qwen3-VL 技术报告

我们推出 Qwen3-VL，这是截至目前 Qwen 系列中最强大的视觉语言模型，在广泛的多模态基准上实现了卓越的性能……

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[Paper] 作者已逝，但如果他们从未活着呢？一次关于捷克 AI 与人类创作诗歌的接受实验

大型语言模型在生成创意文本方面的能力日益提升，然而大多数关于 AI 生成诗歌的研究仍聚焦于英语——一种占主导地位的语言……

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 可伸缩无关的 Kolmogorov‑Arnold 几何在神经网络中的应用

最近，Freedman 和 Mulligan 的研究表明，浅层多层感知器在训练过程中会自发地形成 Kolmogorov‑Arnold 几何（KAG）结构，在 t...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 基于GCN的动作识别的主动学习

尽管图卷积网络（GCNs）在基于骨架的动作识别中取得了显著成功，但它们的性能往往依赖于大量的实验室…

#active learning #graph convolutional networks #action recognition #skeleton-based vision #computer vision
5个月前 · ai · - · -

[Paper] TAGFN：在大语言模型时代用于假新闻检测的文本属性图数据集

大型语言模型（LLMs）最近在基于文本属性的图机器学习领域引发了革命，但将LLMs应用于图异常检测、...

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 关于 AI 中算法进步的起源

算法已被估计在 2012 年至 2023 年间将 AI 训练 FLOP 效率提升了 22,000 倍 [Ho et al., 2024]。运行小规模的消融实验…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 超越 URL：元数据多样性与位置用于高效 LLM 预训练

在大型语言模型（LLMs）预训练中加入metadata最近被视为一种加速训练的有前景的方法。然而，以前的工作强调……

#LLM pretraining #metadata #training efficiency #research paper #large language models
5个月前 · devops · - · -

[Paper] 对角线缩放：面向分布式数据库的多维资源模型与优化框架

现代云数据库将扩展呈现为二元决策：通过添加节点进行 scale-out，或通过增加每节点资源进行 scale-up。这种单维视角 i...

#autoscaling #distributed databases #resource optimization #cloud-native #DIAGONALSCALE
5个月前 · ai · - · -

[Paper] 辅助度量帮助解码真实环境中的技能神经元

大型语言模型（LLMs）在广泛任务中展现出卓越的能力，但其内部机制仍然大多不透明。在本文中，w...

#LLM interpretability #skill neurons #auxiliary metrics #neuron probing #model debugging
5个月前 · ai · - · -

[Paper] 超越准确性：对 Imputation 中 Uncertainty Estimation 的实证研究

处理缺失数据是数据驱动分析中的核心挑战。现代 imputation 方法不仅旨在实现精确重建，而且在 … 方面也有所不同。

#imputation #uncertainty estimation #calibration #deep generative models #benchmark
5个月前 · ai · - · -

[Paper] ReSAM：细化、重新查询与强化：自提示点监督遥感图像分割

交互式分割模型，例如 Segment Anything Model（SAM），在自然图像上展示了显著的泛化能力，但表现不佳……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] TAB-DRW：一种基于DFT的生成式表格数据鲁棒水印

生成式 AI 的兴起使得在医疗、金融和公共政策等领域能够生成高保真度的合成表格数据，这不仅提升了数据可用性，还带来了诸多挑战和机遇。随着合成数据质量的不断提升，研究人员和从业者开始探索其在数据共享、隐私保护以及模型训练等方面的潜在应用。然而，合成数据的真实性、偏差以及对下游任务的影响仍是亟待解决的问题。本文综述了当前生成式 AI 在合成表格数据生成中的最新进展，重点讨论了模型架构、评估指标以及实际应用场景，并提出了未来研究的可能方向。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[论文] 通过降维可视化 LLM 潜在空间几何

Large language models (LLMs) achieve state-of-the-art results across many natural language tasks, but their internal mechanisms remain difficult to interpret. I...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

MoGAN：通过少步运动对抗后训练提升视频扩散中的运动质量

视频扩散模型在帧级保真度方面表现出色，但仍在运动连贯性、动态性和真实感方面存在困难，常常会产生抖动、重影或 …

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[论文] 大语言模型中先天规划的局限性

大型语言模型（LLMs）在许多基准测试中取得了令人印象深刻的结果，但它们在规划和有状态推理方面的能力仍不明确。我们研究了……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] AI驱动的混合网络物理框架用于智能电网的自适应控制

智能电网是经典电力基础设施与先进通信网络和智能控制的融合，旨在创建一个网络物理环境……

#smart grid #cybersecurity #machine learning #cloud computing #forensic analytics
5个月前 · ai · - · -

[Paper] 基于模型的策略适应用于闭环端到端自动驾驶

端到端（E2E）自动驾驶模型在开放环评估中表现出强大的性能，但往往会出现级联错误和泛化能力差的问题……

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 基于深度学习的口腔病变多类分类与分层增强

口腔癌在全球范围内非常常见，且大多在晚期才被诊断，因为它在视觉上与良性、癌前以及恶性病变非常相似。

#oral lesions #multiclass classification #medical imaging #data augmentation #deep learning
5个月前 · ai · - · -

[Paper] 学习何时停止：Adaptive Latent Reasoning via Reinforcement Learning

Latent reasoning 代表了 Transformer 语言模型的一个新发展，与 chain-of-thought 相比，它在压缩推理长度方面显示出潜力。

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] Harmony：通过跨任务协同实现音频与视频生成的和谐

同步音视频内容的合成是生成式 AI 的关键挑战，开源模型在实现稳健的音视频对齐方面面临困难……

#audio-visual generation #multimodal diffusion #cross-modal synchronization #generative AI #research
5个月前 · ai · - · -

[Paper] HarmonicAttack：自适应跨域音频水印去除

高质量的 AI 生成音频的可用性带来了安全挑战，例如错误信息宣传活动和语音克隆欺诈。针对…的关键防御是…

#audio watermarking #deep learning #adversarial attack #AI security #speech synthesis
5个月前 · ai · - · -

[Paper] 基于2D/3D配准损失的盆腔透视增强标志点检测模型

自动标志点检测为医疗专业人员提供了一种高效的方法，以利用术中了解患者的解剖结构和定位。

#landmark detection #2D/3D registration loss #pelvic fluoroscopy #U-Net #medical imaging
5个月前 · ai · - · -

[论文] 多模态鲁棒提示蒸馏用于 3D 点云模型

对抗性攻击对基于学习的 3D 点云模型构成了重大威胁，严重削弱了它们在安全敏感应用中的可靠性。

#research #paper #ai #machine-learning #computer-vision
5个月前 · ai · - · -

[论文] BAMAS：结构化预算感知多智能体系统

Large language model (LLM)-based multi-agent systems 已经成为一种强大的范式，使 autonomous agents 能够解决复杂任务。随着这些系统…

#budget-aware AI #multi-agent systems #LLM cost optimization #integer linear programming #reinforcement learning
5个月前 · ai · - · -

[Paper] 从预测到前瞻：AI 在设计负责任的未来中的作用

在一个以快速技术进步和复杂全球挑战为特征的时代，responsible foresight 已成为政策制定者的关键框架……

#responsible AI #computational foresight #policy #AI ethics #scenario planning
5个月前 · ai · - · -

[Paper] 专家角色LLM的自我透明性失败：大规模行为审计

如果语言模型在专业情境中无法可靠地披露其 AI 身份，用户就无法信任其能力边界。本研究考察了自我透明…

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] RoParQ：面向对同义问句鲁棒性的语言模型同义句感知对齐

大型语言模型（LLMs）在回答改写后的问题时常表现出不一致的行为，这表明它们更依赖于表层模式而不是…

#research #paper #ai #nlp
5个月前 · ai · - · -

[Paper] 解耦对齐核用于肽膜通透性预测

环肽是针对细胞内位点的有前景的模态；然而，细胞膜渗透性仍然是一个关键瓶颈，并因有限的……而加剧。

#peptide permeability #kernel methods #gaussian processes #drug discovery #machine learning
5个月前 · ai · - · -

[Paper] UAVLight：针对无人机（UAV）场景的光照鲁棒 3D 重建基准

Illumination inconsistency 是多视角 3D 重建中的一个根本性挑战。阳光方向、云层覆盖以及阴影的变化会破坏一致性……

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 机器学习在临床风险预测中的方法：电子健康记录中的多尺度时间对齐

本研究提出了一种基于多尺度时间对齐网络（MSTAN）的风险预测方法，以应对时间不规则性、采样...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 计算针对非线性分类器的策略响应

我们考虑 strategic classification 问题，其中部署 classifier 的行为会导致 strategic behaviour，从而在 s 上产生 distribution shift ...

#strategic classification #non-linear classifiers #dual optimization #machine learning robustness #adversarial training
5个月前 · ai · - · -

[Paper] VacuumVLA: 通过统一的吸取和抓取工具提升 VLA 能力以实现复杂机器人操作

Vision Language Action 模型通过利用大规模预训练的视觉和语言表征，显著推动了通用机器人操作的进步。

#research #paper #ai #machine-learning
5个月前 · devops · - · -

[Paper] MAD-DAG：保护区块链共识免受MEV

区块链安全受到自私挖矿的威胁，自私挖矿是指矿工（运营者）偏离协议以增加其收入。自私挖矿会加剧……

#research #paper #devops
5个月前 · ai · - · -

[Paper] MMA：一种用于惯性传感器的人体活动识别的动量蟒蛇架构

Human activity recognition (HAR) from inertial sensors is essential for ubiquitous computing, mobile health, and ambient intelligence. Conventional deep models ...

#research #paper #ai #machine-learning
5个月前 · ai · - · -

[Paper] 视频生成模型是优秀的潜在奖励模型

Reward feedback learning（ReFL）已被证明在将图像生成与人类偏好对齐方面有效。然而，将其扩展到视频生成面临…

#research #paper #ai #computer-vision
5个月前 · ai · - · -

[Paper] 上下文特定因果图发现（未观测上下文）：非平稳性、状态与时空模式

现实世界的数据，例如在气候应用中，通常由空间网格化时间序列数据或具有类似结构的数据组成。虽然其底层…

#causal discovery #non‑stationary data #context‑specific graphs #machine learning
5个月前 · devops · - · -

[论文] 数据冗余对 MLFMA 近场计算加速效果的建模

多层快速多极算法（MLFMA）中的近场（P2P）算子由于内存局部性差，在 GPU 上成为性能瓶颈。本文工作…

#research #paper #devops
5个月前 · ai · - · -

[Paper] Bangla 手语翻译：数据集创建挑战、基准测试与前景

Bangla Sign Language Translation (BdSLT) 迄今为止受到严重限制，因为该语言本身资源极其匮乏。标准的句子级数据集创建……

#sign-language #dataset #translation #computer-vision #benchmark

Newer posts

Older posts