[Paper] KerJEPA:欧几里得自监督学习的核差异
近期在自监督 Joint-Embedding Predictive Architectures(JEPAs)方面的突破表明,正则化欧几里得表示以趋向 iso...
近期在自监督 Joint-Embedding Predictive Architectures(JEPAs)方面的突破表明,正则化欧几里得表示以趋向 iso...
最近,一波具备思考能力的 Large Language Models 出现了,它们在各种推理基准上展示了卓越的能力。...
姿态控制对于许多卫星任务至关重要。然而,Classical controllers 的设计耗时且对模型不确定性敏感,...
我们审视人类与 LLM 交互所带来的 epistemological 威胁。我们发展集体 epistemology,作为一种在个体之间分布的 epistemic warrant 理论……
人工智能已成为全球技术竞争的关键领域,也是欧洲追求技术主权的核心关注点。这……
带有可验证奖励的群体相对强化学习(RLVR)经常浪费它已经拥有的最有信息量的数据——即失败。当所有 rollouts 都是 w...
在本文中,我们在序数回归设置中引入了方向性反馈,其中学习者会收到关于预测标签是否在……的反馈。
我们推出了 Algerian Dialect,一个大规模情感标注数据集,包含 45,000 条用阿尔及利亚阿拉伯方言撰写的 YouTube 评论。我们收集的评论……
大气湍流在包括光学成像、遥感和自由空间光学等广泛应用中构成了根本性的限制。
大型语言模型(LLMs)和多模态LLMs正在改变事件抽取(EE):提示和生成往往能够在零样本情况下产生结构化输出……
预测在连续溶剂组成范围内的反应结果仍然是有机合成和工艺化学中的一项关键挑战。传统的 m...
多样化编程语言的快速激增为开发多语言代码 LLM 带来了机遇和挑战。虽然现有技术……
在海洋生物实验室(Marine Biological Laboratory)的记忆研究中,Plato 观察到每一次经历都会触发大脑的变化,这些变化由长期记忆驱动。今天,神经…
理解源代码的变更及其对其他代码实体的影响是软件开发中的关键技能。然而,对代码变更的分析以及……
及时且准确的情境报告对于人道主义决策至关重要,然而当前的工作流仍然在很大程度上是手动的、资源密集型的,并且…
推荐系统是实现个性化内容投放(从而带来收入)的关键技术,广泛用于许多大型公司。在过去十年中,深度学习推荐……
我们研究强子线性 MPC 模型与经典的 graph‑centric 分布式模型之间的关系,重点关注 Node‑Capacitated Clique (NCC),一种带宽……
城市地下电缆建设对于提升城市电网的可靠性至关重要,但其高昂的建设成本使得规划变得值得……
Neural code models 已日益被纳入软件开发流程。然而,它们对 backdoor attacks 的易感性带来了显著…
高效利用 GPU 计算对于提升用户体验和降低大语言模型(LLM)服务的运营成本至关重要。然而,当前...
本文通过对研究者编码和对R的论述性贡献的分析,探讨了未被认可的劳动在企业创新系统中的作用,……
去中心化联邦学习(Decentralized federated learning,DFL)使得在边缘设备之间进行协作模型训练成为可能,无需中心化协调,提供了对 ...
Bangla 是一种代码生成的低资源语言,缺乏大规模标注数据集和将自然语言规范转换为可执行代码的工具。
将 over-the-air computations (OAC) 融入联邦学习 (FL) 的模型训练过程是一种有效的方式,以缓解通信……