[Paper] Delta Sum Learning:一种在 Gossip Learning 中实现快速全局收敛的方法
联邦学习是一种因其安全性和计算优势而受到欢迎的分布式学习方法。随着网络中强大设备的出现……
联邦学习是一种因其安全性和计算优势而受到欢迎的分布式学习方法。随着网络中强大设备的出现……
Covid 使在线教学和学习变得被接受,学生、教师和行业专业人士都对这种模式感到舒适。这种舒适感可以……
我们提出基于Conformer的解码器用于LibriBrain 2025 PNPL竞赛,针对两个基础的MEG任务:Speech Detection 和 Phoneme Classification……
许多现代软件项目发展迅速,以纳入新功能和安全补丁。用户将其依赖项更新到更安全的版本非常重要。
Serverless 大型语言模型(LLMs)已成为通过实现“pay-as-you-go”定价模式来部署 AI 服务的成本有效解决方案……
本文介绍了一种基于归一化 Pascal(二项式)系数的新型多父代重组算子族,用于遗传算法(GAs)。Unl...
在本文中,我们研究了一种 neural network model,其中计算节点之间的 weights 根据局部学习规则(local learning rule)进行修改。为了确定 w…
Machine Consciousness Hypothesis 认为,意识是一种与基底无关的功能属性,存在于能够进行二阶感知的计算系统中……
在异构边缘环境中对大规模 foundation models 进行推理,需要一个根本可重构的 orchestration substrate。Static …
联邦微调为在保护数据隐私的同时,将大型语言模型(LLMs)适配到下游任务提供了有前景的解决方案。然而,它的hi...
Microservices 已经通过创建模块化和独立的服务,改变了 software architecture。然而,它们引入了 operational complexities …
Quality-Diversity (QD) 算法构成了优化的一个分支,旨在发现多样且高质量的解集合,以实现优化……
随着大语言模型(LLMs)通过张量并行(TP)和流水线并行(PP)进行规模扩展,生产堆栈已经积极优化了数据……
对动态视觉内容进行推理仍然是多模态大型语言模型的核心挑战。最近的思考模型生成显式的推理轨迹。
近期的多模态大语言模型(MLLMs)在视频理解方面取得了进展,但大多数仍然是“思考视频”,即一旦视频被编码,推理……
开发稳健的世界模型推理对于大型语言模型(LLM)代理在复杂环境中进行规划和交互至关重要。虽然多轮交互……
最近,多人视频生成开始受到关注。虽然已有少数初步工作探索了音频驱动的多人说话视频生成……
近期在大型语言模型(LLMs)方面的进展已经促成了数学发现的突破,以 AlphaEvolve 为例,这是一个闭源系统,...
大型视觉语言模型(VLMs)通过广泛的预训练,有效弥合模态差距,获取与视觉表示相匹配的复杂特征……
当前的世界模型缺乏统一且受控的系统评估环境,这使得难以评估它们是否真正捕捉到了底层的 ru...
近年来,语言模型在高级基准上取得了巨大的进展,但这些进展在很大程度上只能通过使用更昂贵的模型来实现……
Deep learning 方法在 object detection 方面已经实现了对图像中特定目标类别的可靠检测。然而,扩展模型的检测能力…
Inverse heat problems 指的是在已观测或已知的热扩散行为下,对材料热物理属性进行估计。Inverse heat problems 已经…
本文研究了激活函数在使用两层神经网络学习模加法中的作用。我们首先建立了一个明确的表达能力差距:si...