[Paper] FedHypeVAE:联邦学习与超网络生成的条件VAE用于差分隐私嵌入共享
联邦数据共享承诺在不集中原始数据的情况下提供实用性,但现有的嵌入级生成器在非IID客户端异质性和p...
4750 posts from this source
联邦数据共享承诺在不集中原始数据的情况下提供实用性,但现有的嵌入级生成器在非IID客户端异质性和p...
基于梯度的优化在处理分类变量时通常依赖于 score-function estimators,它们是无偏的但噪声较大,或者依赖于 continuous relaxations……
虽然视觉语言模型(VLMs)和多模态大语言模型(MLLMs)在检测图像和视频深度伪造方面表现出强大的泛化能力,但它们的…
投资组合优化是所有主要金融机构开展的任务。基数约束均值-方差投资组合优化(Cardinality Constrained Mean-Variance Portfolio Optimization,CCP)...
结构化形状补全将缺失的几何体恢复为基元,而不是无结构点,这使得基元驱动的表面重建成为可能。 In...
大型语言模型(LLMs)已成为许多日常应用的主流。然而,随着数据的演变,它们的知识很快就会过时。持续…
随着自主 AI 代理从代码补全工具转变为能够大规模打开拉取请求(PR)的完整团队成员,软件维护者 fa...
评估足球中的无球防守表现具有挑战性,因为传统指标无法捕捉限制对手的细微协同动作……
最先进的大型语言模型(LLM)流水线依赖于自举推理循环:采样多样的思考链,并强化得分最高的……
将符号约束集成到深度学习模型中可以使它们更具鲁棒性、可解释性和数据效率。尽管如此,这仍然是一个耗时的…
在强化学习中,离策略 actor-critic 方法使用时序差分更新来训练 critic,并将其作为策略(actor)的学习信号……
识别相关文本片段对于自然语言处理(NLP)中的多个下游任务非常重要,因为它有助于模型可解释性。虽然大多数片段识别方法……
手写的 STEM 考试捕捉开放式推理和图示,但人工评分速度慢且难以规模化。我们提出了一种端到端的工作流用于评分……
我们提出一个强化学习(RL)框架,用于线性求解器的自适应精度调节,并且可以扩展到通用算法。该框架是 …
深度神经网络在制造业中自动化各种视觉质量检测任务方面显示出巨大的潜力。然而,它们的适用性在…
Vision-Language Models 已经在医学图像分析和疾病诊断中展示了强大的潜力。然而,在部署后,它们的性能可能…
在数字成像中,图像去马赛克是一个关键的第一步,它从颜色滤光阵列(CFA)中恢复RGB信息。通常,深度学习被…
使用 transformer 进行长期时间序列预测受到自注意力二次复杂度和统一切片刚性的阻碍,这可能会……
现有用于推断行人过街行为的范式,从统计模型到监督学习方法,表现出有限的泛化能力……
Ticket troubleshooting 指的是通过工单系统报告的问题进行分析和解决的过程。在大型组织提供的…
本文提出了一种遗传算法(GA)方法,用于生产线中成本最优的任务调度。系统由一组串行处理任务组成……
语言模型(LM)概率并不是可靠的质量评估指标,因为自然语言是模糊的。当多个输出选项都是有效的时,模型的概率……
大型语言模型(LLMs)因其高性能(例如准确率)而逐渐成为解决众多自然语言任务的突出 AI 模型……
生成奖励模型(Generative Reward Models,GRMs)因其可解释性、推理时的可扩展性以及……而在奖励建模领域受到广泛研究兴趣。
现代语言模型中的序列建模层通常在存储容量和计算效率之间面临权衡。虽然 Softmax attention …
脉冲神经网络(SNN)是对时空数据进行处理的动力系统,但它们的可学习参数通常仅限于突触权重,...
Large Protein Models 已显示出在 generative protein design 方面的强大潜力,但它们经常产生 structural hallucinations,生成序列……
在移动和边缘计算环境中部署大型语言模型(LLMs)受到设备资源有限、无线带宽稀缺以及…
大型语言模型(LLMs)经常产生上下文幻觉,即生成的内容与提示中明确陈述的信息相矛盾或被忽略。
将人工智能集成到软件工程(SE)中,需要拥有一套针对 SE 任务精心挑选的模型集合。随着模型数量达到数百万……
实时日志分析是现代基础设施可观测性的基石。然而,现有的在线解析器在架构上并不适合动态……
智能联网车辆(ICVs)是现代交通系统的核心组成部分,其安全性至关重要,因为它直接关系到用户安全……
传统的客户支持系统,例如交互式语音应答(Interactive Voice Response (IVR)),依赖于僵化的脚本,缺乏处理复杂、…所需的灵活性。
事件相关电位(ERP),一种专门的脑电图(EEG)范式,反映了对外部刺激或事件的神经反应,通常……
虽然关于零售工作负载的特定平台性能的实证研究很少,但零售行业的数字化转型已经加速了……
在本文中,我们探讨 federated customization of large models,并强调它在 federated learning 框架中带来的关键挑战。我们回顾……
Large Language Model (LLM) 基于的应用正日益在包括客户服务、教育和出行等各个领域部署。然而,...
AI agents 在 software development 中的主要价值在于它们能够扩展开发者的推理和行动能力,而不是取代人类……
Autonomous coding agents 正日益被部署为现代软件工程中的 AI teammates,能够独立创建修改生产代码的 pull requests (PRs)…
模型驱动工程(Model-driven engineering,MDE)提供抽象和分析严谨性,但在许多领域的工业采用受到开发……成本的限制。
人工智能(AI)和深度学习的进步引发了对其日益增长的能源消耗的担忧,同时对在移动设备上部署 AI 的需求……
本文探讨了自动检测 software similarities 的复杂性,结合 digital artifacts 的独特挑战,并介绍了……
self-attention 机制的二次复杂度对将 Transformer 模型应用于长序列构成了显著障碍。本文工作探索…
我们提出了Consensus-Based Privacy-Preserving Data Distribution (CPPDD)框架,这是一种轻量级且在设置后自主运行的安全多客户端协议……
部署 LLMs 高效地需要测试数百种 serving 配置,但在 GPU cluster 上评估每一种都需要数小时,且花费数千美元……
随着对高性能和高效率计算需求的不断增长,云计算,尤其是 serverless computing,已逐渐成为研究的热点……
人类生物系统通过非凡的韧性维持生命,不断检测损伤,协调有针对性的响应,并恢复功能 t...
在最近几十年,RAFT 分布式共识算法已成为分布式系统生态系统的主要支柱,确保数据一致性和容错……