[Paper] 多层特征融合用于视觉质量检测的持续学习
深度神经网络在制造业中自动化各种视觉质量检测任务方面显示出巨大的潜力。然而,它们的适用性在…
3296 posts from this source
深度神经网络在制造业中自动化各种视觉质量检测任务方面显示出巨大的潜力。然而,它们的适用性在…
Vision-Language Models 已经在医学图像分析和疾病诊断中展示了强大的潜力。然而,在部署后,它们的性能可能…
在数字成像中,图像去马赛克是一个关键的第一步,它从颜色滤光阵列(CFA)中恢复RGB信息。通常,深度学习被…
使用 transformer 进行长期时间序列预测受到自注意力二次复杂度和统一切片刚性的阻碍,这可能会……
现有用于推断行人过街行为的范式,从统计模型到监督学习方法,表现出有限的泛化能力……
Ticket troubleshooting 指的是通过工单系统报告的问题进行分析和解决的过程。在大型组织提供的…
本文提出了一种遗传算法(GA)方法,用于生产线中成本最优的任务调度。系统由一组串行处理任务组成……
语言模型(LM)概率并不是可靠的质量评估指标,因为自然语言是模糊的。当多个输出选项都是有效的时,模型的概率……
大型语言模型(LLMs)因其高性能(例如准确率)而逐渐成为解决众多自然语言任务的突出 AI 模型……
生成奖励模型(Generative Reward Models,GRMs)因其可解释性、推理时的可扩展性以及……而在奖励建模领域受到广泛研究兴趣。
现代语言模型中的序列建模层通常在存储容量和计算效率之间面临权衡。虽然 Softmax attention …
脉冲神经网络(SNN)是对时空数据进行处理的动力系统,但它们的可学习参数通常仅限于突触权重,...
Large Protein Models 已显示出在 generative protein design 方面的强大潜力,但它们经常产生 structural hallucinations,生成序列……
在移动和边缘计算环境中部署大型语言模型(LLMs)受到设备资源有限、无线带宽稀缺以及…
大型语言模型(LLMs)经常产生上下文幻觉,即生成的内容与提示中明确陈述的信息相矛盾或被忽略。
将人工智能集成到软件工程(SE)中,需要拥有一套针对 SE 任务精心挑选的模型集合。随着模型数量达到数百万……
实时日志分析是现代基础设施可观测性的基石。然而,现有的在线解析器在架构上并不适合动态……
智能联网车辆(ICVs)是现代交通系统的核心组成部分,其安全性至关重要,因为它直接关系到用户安全……
传统的客户支持系统,例如交互式语音应答(Interactive Voice Response (IVR)),依赖于僵化的脚本,缺乏处理复杂、…所需的灵活性。
事件相关电位(ERP),一种专门的脑电图(EEG)范式,反映了对外部刺激或事件的神经反应,通常……
虽然关于零售工作负载的特定平台性能的实证研究很少,但零售行业的数字化转型已经加速了……
在本文中,我们探讨 federated customization of large models,并强调它在 federated learning 框架中带来的关键挑战。我们回顾……
Large Language Model (LLM) 基于的应用正日益在包括客户服务、教育和出行等各个领域部署。然而,...
AI agents 在 software development 中的主要价值在于它们能够扩展开发者的推理和行动能力,而不是取代人类……
Autonomous coding agents 正日益被部署为现代软件工程中的 AI teammates,能够独立创建修改生产代码的 pull requests (PRs)…
模型驱动工程(Model-driven engineering,MDE)提供抽象和分析严谨性,但在许多领域的工业采用受到开发……成本的限制。
人工智能(AI)和深度学习的进步引发了对其日益增长的能源消耗的担忧,同时对在移动设备上部署 AI 的需求……
本文探讨了自动检测 software similarities 的复杂性,结合 digital artifacts 的独特挑战,并介绍了……
self-attention 机制的二次复杂度对将 Transformer 模型应用于长序列构成了显著障碍。本文工作探索…
我们提出了Consensus-Based Privacy-Preserving Data Distribution (CPPDD)框架,这是一种轻量级且在设置后自主运行的安全多客户端协议……
部署 LLMs 高效地需要测试数百种 serving 配置,但在 GPU cluster 上评估每一种都需要数小时,且花费数千美元……
随着对高性能和高效率计算需求的不断增长,云计算,尤其是 serverless computing,已逐渐成为研究的热点……
人类生物系统通过非凡的韧性维持生命,不断检测损伤,协调有针对性的响应,并恢复功能 t...
在最近几十年,RAFT 分布式共识算法已成为分布式系统生态系统的主要支柱,确保数据一致性和容错……
在汽车生产工厂中,车辆喷漆工艺使用多个机器人臂同时对沿输送带前进的车身进行喷漆。
基于深度神经网络的分类器在处理对抗样本(AEs)时容易出错。对抗样本是对输入数据进行最小扰动后生成的,肉眼难以察觉……
人工智能(AI)的快速增长带来了新颖的数据处理和生成能力,但也导致了能源需求的不断上升。这种……
各个领域系统的日益复杂和相互关联导致人们对研究复杂网络的兴趣日益增长,尤其是 Scal...
我们提出了 SpaceTimePilot,一种视频扩散模型,能够将空间和时间解耦,以实现可控生成渲染。给定单目视频,SpaceTimePil...
最近在3D重建方面的进展在从密集多视图图像捕获高质量场景方面取得了显著进展,但在输入视角…
类人机器人在以人为中心的环境中具有巨大的潜力,但实现头部、手部和腿部的稳健全身协同仍然是一个挑战……
我们提出 Edit3r,一个前馈框架,能够在一次传递中从未配准、视角不一致、经过指令编辑的图像中重建并编辑 3D 场景。U...
High-stakes decision making 涉及对未来不确定性的推理。在本工作中,我们训练 language models 对 open-ended 进行预测……
从 temporally corrupted skeleton sequences 中识别 fine-grained actions 仍然是一个重大挑战,尤其是在 online 的真实场景中……
音频驱动的视觉配音旨在将视频的唇部动作与新的语音同步,但由于缺乏理想的训练数据,根本上面临挑战:pai...
现代操作系统和分布式系统中的资源管理任务仍主要依赖于手工设计的 heuristics,用于 scheduling、caching 等任务。
尽管规模庞大且取得了成功,现代 transformers 几乎普遍被训练为单一目标的系统:优化产生一组确定性的参数……
Clock 和 Pizza 解释与在 uniform 或 learnable attention 上有所不同的架构相关,被提出用来论证不同的 a...