[Paper] PEAK:一种基于自然语言转换的 GPU 内核性能工程 AI 助手
大型语言模型(LLMs)的进展正显示出对软件开发和编程辅助的有希望的影响。然而,这些模型在……方面仍然存在困难。
大型语言模型(LLMs)的进展正显示出对软件开发和编程辅助的有希望的影响。然而,这些模型在……方面仍然存在困难。
自动化前端工程显著缩短开发周期并最小化手动编码开销。虽然 Generative AI 在翻译方面展现出潜力……
对即将到来的项目迭代(sprint)的规划是 Scrum 规划中的关键活动之一。本文中,我们展示了正在进行的关于探索 … 的工作。
动态多模态多目标优化呈现出双重挑战:既要同时跟踪多个等价的Pareto最优集合,又要保持Pareto前沿的……
大型语言模型(LLMs)执行复杂的多轮交互协议,但缺乏正式规范来验证其执行是否符合设计者的意图。我们…
Catastrophic forgetting 在 continual learning 中构成了根本性的挑战,尤其是当模型为了 deployment efficiency 而被 quantized 时。我们系统地……
Vision-Language-Action (VLA) 模型将视觉和语言与具身控制对齐,但当仅依赖于 t 时,它们的对象指代能力仍然有限。
差分隐私(DP)已成为保护推荐系统中用户数据的黄金标准,但现有的隐私保护机制面临着困难……
在生成模型中进行艺术风格迁移仍然是一个重大挑战,因为现有方法通常仅通过 model fine-tuning、additional a...
本工作提出了一种新颖的非线性最优滤波器,即 Ensemble Schrödinger Bridge 非线性滤波器。所提出的滤波器实现了 sta 的结合。
在不相交的数据集上进行训练可以实现两个主要目标:加速数据处理和实现联邦学习。已经确定 Ko...
随着计算从云端转向边缘以降低处理延迟和网络流量,产生的计算连续体(Computing Continuum,CC)创建了一个动态的环境……
多模态大型语言模型(MLLMs)结合视觉和文本表示,以实现丰富的推理能力。然而,高计算成本……
多年来,自动 MT 指标已经在基准上不断攀升,并且在与人工评分的吻合度上表现出强劲且有时达到人类水平的一致性。然而,它们仍然 bl...
我们提出 Gabliteration,这是一种新颖的神经权重修改技术,通过实现自适应多方向……
Vocabulary-free fine-grained image recognition 旨在在没有固定的人为定义标签集的情况下,区分元类内部视觉上相似的类别。Exi...
高性能计算(HPC)工作负载正变得日益多样化,作业特征呈现出很大的变动性,然而集群调度仍然……
深度神经网络经常利用捷径。这些是与训练数据中的输出标签相关联的虚假线索,但与任务语义无关。
基于高性能计算(HPC)的模拟在天体物理学和宇宙学(A&C)中至关重要,帮助科学家研究和理解复杂的……
对项目(题目或任务)难度的准确估计对教育评估至关重要,但面临冷启动问题。虽然大型语言模型…
手写文本识别和光学字符识别解决方案在处理现代时代的数据时表现出色,但效率在 La... 时会下降。
我们研究了一个 Hopf 代数 Markov 链的动力学性质,其状态空间是带标签叶子的二叉根森林。这个 Markov 动力系统……
Mixture-of-Experts(MoE)已成为大规模语言模型(LLMs)中的主导架构,因为它能够通过稀疏专家激活来扩展模型容量……
记忆增强的脉冲神经网络(SNN)有望实现能效高的类脑计算,但它们在不同感官模态间的泛化仍未得到充分验证……