[Paper] LeLaR:首个在轨演示的基于AI的卫星姿态控制器
姿态控制对于许多卫星任务至关重要。然而,Classical controllers 的设计耗时且对模型不确定性敏感,...
4750 posts from this source
姿态控制对于许多卫星任务至关重要。然而,Classical controllers 的设计耗时且对模型不确定性敏感,...
我们审视人类与 LLM 交互所带来的 epistemological 威胁。我们发展集体 epistemology,作为一种在个体之间分布的 epistemic warrant 理论……
人工智能已成为全球技术竞争的关键领域,也是欧洲追求技术主权的核心关注点。这……
带有可验证奖励的群体相对强化学习(RLVR)经常浪费它已经拥有的最有信息量的数据——即失败。当所有 rollouts 都是 w...
在本文中,我们在序数回归设置中引入了方向性反馈,其中学习者会收到关于预测标签是否在……的反馈。
我们推出了 Algerian Dialect,一个大规模情感标注数据集,包含 45,000 条用阿尔及利亚阿拉伯方言撰写的 YouTube 评论。我们收集的评论……
大气湍流在包括光学成像、遥感和自由空间光学等广泛应用中构成了根本性的限制。
大型语言模型(LLMs)和多模态LLMs正在改变事件抽取(EE):提示和生成往往能够在零样本情况下产生结构化输出……
预测在连续溶剂组成范围内的反应结果仍然是有机合成和工艺化学中的一项关键挑战。传统的 m...
多样化编程语言的快速激增为开发多语言代码 LLM 带来了机遇和挑战。虽然现有技术……
理解源代码的变更及其对其他代码实体的影响是软件开发中的关键技能。然而,对代码变更的分析以及……
及时且准确的情境报告对于人道主义决策至关重要,然而当前的工作流仍然在很大程度上是手动的、资源密集型的,并且…
推荐系统是实现个性化内容投放(从而带来收入)的关键技术,广泛用于许多大型公司。在过去十年中,深度学习推荐……
我们研究强子线性 MPC 模型与经典的 graph‑centric 分布式模型之间的关系,重点关注 Node‑Capacitated Clique (NCC),一种带宽……
城市地下电缆建设对于提升城市电网的可靠性至关重要,但其高昂的建设成本使得规划变得值得……
Neural code models 已日益被纳入软件开发流程。然而,它们对 backdoor attacks 的易感性带来了显著…
高效利用 GPU 计算对于提升用户体验和降低大语言模型(LLM)服务的运营成本至关重要。然而,当前...
本文通过对研究者编码和对R的论述性贡献的分析,探讨了未被认可的劳动在企业创新系统中的作用,……
去中心化联邦学习(Decentralized federated learning,DFL)使得在边缘设备之间进行协作模型训练成为可能,无需中心化协调,提供了对 ...
Bangla 是一种代码生成的低资源语言,缺乏大规模标注数据集和将自然语言规范转换为可执行代码的工具。
将 over-the-air computations (OAC) 融入联邦学习 (FL) 的模型训练过程是一种有效的方式,以缓解通信……
大型语言模型(LLMs)的进展正显示出对软件开发和编程辅助的有希望的影响。然而,这些模型在……方面仍然存在困难。
自动化前端工程显著缩短开发周期并最小化手动编码开销。虽然 Generative AI 在翻译方面展现出潜力……
对即将到来的项目迭代(sprint)的规划是 Scrum 规划中的关键活动之一。本文中,我们展示了正在进行的关于探索 … 的工作。
动态多模态多目标优化呈现出双重挑战:既要同时跟踪多个等价的Pareto最优集合,又要保持Pareto前沿的……
大型语言模型(LLMs)执行复杂的多轮交互协议,但缺乏正式规范来验证其执行是否符合设计者的意图。我们…
Catastrophic forgetting 在 continual learning 中构成了根本性的挑战,尤其是当模型为了 deployment efficiency 而被 quantized 时。我们系统地……
Vision-Language-Action (VLA) 模型将视觉和语言与具身控制对齐,但当仅依赖于 t 时,它们的对象指代能力仍然有限。
差分隐私(DP)已成为保护推荐系统中用户数据的黄金标准,但现有的隐私保护机制面临着困难……
在生成模型中进行艺术风格迁移仍然是一个重大挑战,因为现有方法通常仅通过 model fine-tuning、additional a...
本工作提出了一种新颖的非线性最优滤波器,即 Ensemble Schrödinger Bridge 非线性滤波器。所提出的滤波器实现了 sta 的结合。
在不相交的数据集上进行训练可以实现两个主要目标:加速数据处理和实现联邦学习。已经确定 Ko...
随着计算从云端转向边缘以降低处理延迟和网络流量,产生的计算连续体(Computing Continuum,CC)创建了一个动态的环境……
多模态大型语言模型(MLLMs)结合视觉和文本表示,以实现丰富的推理能力。然而,高计算成本……
多年来,自动 MT 指标已经在基准上不断攀升,并且在与人工评分的吻合度上表现出强劲且有时达到人类水平的一致性。然而,它们仍然 bl...
我们提出 Gabliteration,这是一种新颖的神经权重修改技术,通过实现自适应多方向……
Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下,区分元类内部视觉上相似的类别。Exi...
高性能计算(HPC)工作负载正变得日益多样化,作业特征呈现出很大的变动性,然而集群调度仍然……
深度神经网络经常利用捷径。这些是与训练数据中的输出标签相关联的虚假线索,但与任务语义无关。
基于高性能计算(HPC)的模拟在天体物理学和宇宙学(A&C)中至关重要,帮助科学家研究和理解复杂的……
对项目(题目或任务)难度的准确估计对教育评估至关重要,但面临冷启动问题。虽然大型语言模型…
手写文本识别和光学字符识别解决方案在处理现代时代的数据时表现出色,但效率在 La... 时会下降。
我们研究了一个 Hopf 代数 Markov 链的动力学性质,其状态空间是带标签叶子的二叉根森林。这个 Markov 动力系统……
Mixture-of-Experts(MoE)已成为大规模语言模型(LLMs)中的主导架构,因为它能够通过稀疏专家激活来扩展模型容量……
记忆增强的脉冲神经网络(SNN)有望实现能效高的类脑计算,但它们在不同感官模态间的泛化仍未得到充分验证……
本文研究了可修复系统的双目标冗余分配问题(RAP),其目标定义为成本最小化和可用性最大化……
现代潜在扩散模型(LDM)通常在低层次的变分自编码器(VAE)潜在空间中运行,这些空间主要针对像素级的重建进行优化。
单目深度估计仍然具有挑战性,因为最近的基础模型,如 Depth Anything V2 (DA-V2),在处理与真实世界图像相差甚远的情况时表现不佳。