[论文] 车辆喷漆机器人路径规划的层次优化
在汽车生产工厂中,车辆喷漆工艺使用多个机器人臂同时对沿输送带前进的车身进行喷漆。
4750 posts from this source
在汽车生产工厂中,车辆喷漆工艺使用多个机器人臂同时对沿输送带前进的车身进行喷漆。
基于深度神经网络的分类器在处理对抗样本(AEs)时容易出错。对抗样本是对输入数据进行最小扰动后生成的,肉眼难以察觉……
人工智能(AI)的快速增长带来了新颖的数据处理和生成能力,但也导致了能源需求的不断上升。这种……
各个领域系统的日益复杂和相互关联导致人们对研究复杂网络的兴趣日益增长,尤其是 Scal...
我们提出了 SpaceTimePilot,一种视频扩散模型,能够将空间和时间解耦,以实现可控生成渲染。给定单目视频,SpaceTimePil...
最近在3D重建方面的进展在从密集多视图图像捕获高质量场景方面取得了显著进展,但在输入视角…
类人机器人在以人为中心的环境中具有巨大的潜力,但实现头部、手部和腿部的稳健全身协同仍然是一个挑战……
我们提出 Edit3r,一个前馈框架,能够在一次传递中从未配准、视角不一致、经过指令编辑的图像中重建并编辑 3D 场景。U...
High-stakes decision making 涉及对未来不确定性的推理。在本工作中,我们训练 language models 对 open-ended 进行预测……
从 temporally corrupted skeleton sequences 中识别 fine-grained actions 仍然是一个重大挑战,尤其是在 online 的真实场景中……
音频驱动的视觉配音旨在将视频的唇部动作与新的语音同步,但由于缺乏理想的训练数据,根本上面临挑战:pai...
现代操作系统和分布式系统中的资源管理任务仍主要依赖于手工设计的 heuristics,用于 scheduling、caching 等任务。
尽管规模庞大且取得了成功,现代 transformers 几乎普遍被训练为单一目标的系统:优化产生一组确定性的参数……
Clock 和 Pizza 解释与在 uniform 或 learnable attention 上有所不同的架构相关,被提出用来论证不同的 a...
现代机器学习(ML)训练和推理现在跨越数十到数万块 GPU,在此过程中,网络故障由于恢复缓慢会浪费 10%–15% 的 GPU 小时。常见的 ne...
本研究提出了一个概念框架和针对基于大型语言模型(LLM)的建筑能源管理系统(BEMS)AI 代理的原型评估,以……
检索增强生成(RAG)对所选上下文的质量高度敏感,但标准的 top‑k 检索往往返回冗余或近似重复的…
判别式分类方法常常学习到在分布内有效的捷径,但在轻微的分布转移下就会失效。这种失效模式源于...
Transformer 语言模型通过将语言建模为一系列 token 来生成惊人自然的文本。然而,仅仅依赖表层共现……
二元选择,通常用于人类反馈强化学习(RLHF),仅传达偏好的方向。一个人可能会选择苹果而不是……
本文的目标是为深度梯度流方法(DGFMs)在求解(高维…)中的应用提供坚实的数学基础。
在过去的几年里,memes 已经从仅仅是幽默交流的媒介演变为一种让用户能够自由表达各种情感的方式,……
扩散语言模型(DLMs)已成为一种有前景的替代自回归模型的方案,可通过并行标记生成实现更快的推理。我们提供...
我们提出了 FoundationSLAM,一个基于学习的单目稠密 SLAM 系统,旨在解决先前基于光流的方法中缺乏几何一致性的问题……
Lifelong person Re-IDentification (L-ReID) 利用顺序收集的数据持续训练和更新 ReID 模型,关注整体性能……
我们引入了一阶迭代优化算法的基本不等式,构建了一个简单且通用的框架,将隐式和显式方法联系起来……
对法律文档进行分类是一项挑战,除了它们的专业词汇外,有时它们可能非常冗长。这意味着将完整文档输入到 T...
真实的视觉模拟无处不在,但它们的创建需要计算时间、渲染以及专业的动画知识。Open-vocabulary 视觉效果...
视觉语言模型(VLMs)正日益被采用为具身代理的核心推理模块。现有基准在 i... 下评估它们的能力。
我们引入了一种用于 possibilistic reasoning 与 fuzzy formal contexts 的 two‑sort weighted modal logic。该逻辑的语法包括两类加权模态……
序列结构是自然认知和行为多个领域的关键特征,例如语言、运动和决策。同样,它也是……
我们使用大型语言模型(LLMs)来揭示来自各种来源的英文文本中的长程结构。许多情况下的条件熵或码长……
准确且可解释的作物病害诊断对农业决策至关重要,然而现有方法往往依赖于成本高昂的监督式 fine‑tuning……
搜索相关性在网络电子商务中发挥核心作用。虽然大语言模型(LLMs)在相关性任务上已显示出显著成果,但现有的基准……
铁路票务系统是最重要的公共服务基础设施之一。在假期等高峰期,它常常面临挑战……
我们展示了对大型语言模型(LLMs)进行迭代部署,每个模型都在用户从前一个模型部署中精心策划的数据上进行微调,能够……
现代云原生系统日益依赖多集群部署,以支持可扩展性、弹性和地理分布。然而,现有的 re...
将量子计算扩展到单个设备之外,需要将多个量子处理单元(QPUs)联网成一个一致的量子‑HPC 系统。我们提出了Mod…
Web3 技术的去中心化架构为反洗钱(Anti-Money Laundering)和反恐怖主义融资(Counter-Financing of Terrorism)合规带来了根本性的挑战。Trad...
测量 function similarity 来检测 bugs 是有效的,但与 bugs 无关的语句可能会因噪声干扰而影响性能……
神经架构搜索(NAS),它自动化深度神经网络(DNN)的架构设计过程,已受到越来越多的关注。多模态...
深度神经网络(DNN)仍然易受对抗性攻击的影响,当在输入图像中添加特定扰动时,会导致误分类。这种...
海马体似乎在大脑中实现了两个核心但高度不同的功能:长期记忆检索以及规划和空间导航。Naivel...
随着大规模模型的发展,传统的 distributed bilevel optimization algorithms 无法直接在 low-resource clients 上应用。关键是……
量子软件工程(QSE)对于确保混合量子‑经典系统的可靠性和可维护性至关重要,然而关于……的实证证据仍然不足。
随着 Software Engineering 进入其新纪元(SE 3.0),AI coding agents 越来越多地自动化软件开发工作流。然而,仍不清楚具体……
自动化程序修复(APR)旨在自动为有缺陷的程序生成正确的补丁。最近利用大语言模型(LLMs)的方法已经…
LLM-based software engineering 正在影响现代软件开发。除了正确性之外,先前的研究还考察了软件的性能。