[Paper] Record-Remix-Replay:使用进化搜索的层次化 GPU 内核优化
随着高性能计算和 AI 工作负载日益依赖 GPU,保持在快速演进的硬件代际中的高性能……
随着高性能计算和 AI 工作负载日益依赖 GPU,保持在快速演进的硬件代际中的高性能……
云原生架构是关于构建和运行可扩展的微服务应用,以充分利用云环境。托管的 Kubernetes …
问题:Intelligence ≠ Empathy 现代 AI 在海量数据集上进行训练,并通过诸如 reinforcement learning from human feedback 等技术进行精炼。Mo...
厌倦了花费数小时手动测量照片、查找材料价格并计算报价吗?对于handyman业务来说,这类后台工作是一个主要的痛点……
在上一篇文章 https://dev.to/rijultp/understanding-transformers-part-4-introduction-to-self-attention-45bg 中,我们探讨了 self‑attention 概念用于 t...
图像分类听起来很容易,直到你记得计算机从不直接看到“对象”。它只看到像素数组。本文解释了这为何使得 k‑NN 成为一种…
MLP = 一个函数而不是层 大多数人认为神经网络是层的堆叠,但他们错了。 一个 MLP 是:y = f(x); θ 👉 一个可学习的函数。 从简单开始……
真正的问题:低 training loss ≠ 好 model。真正的目标:generalization。Optimization = Learning。Optimization 通过更新 parameters 来降低 loss。没有…
问题:在机器学习项目中运行 `pip install -r requirements.txt` 时,控制台会输出数百行内容:下载进度条,w...
Prompt learning 是一种参数高效的视觉语言模型方法,但其在标签噪声下的鲁棒性研究较少。视觉内容包含……
视觉语言模型(VLMs)仍然在视觉感知任务(如空间理解和视点识别)上表现困难。一个可能的促成因素是...
大型视觉语言模型(LVLMs)在多模态推理方面表现出色,但常常出现幻觉并以高度确定性给出错误答案,……
我们提出了 RecaLLM,这是一套经过后训练的推理语言模型,旨在有效利用长上下文信息。In‑context retrieval(上下文检索),用于识别……
模型投毒攻击对联邦学习(FL)构成了显著的安全威胁。大多数现有的模型投毒攻击依赖于合谋,需要对手...
成功的 machine learning 在 graphs 或 networks 上需要 embeddings,这些 embeddings 不仅将 nodes 和 edges 表示为 low-dimensional vectors,还要保留 …
《易经》King Wen序列(约公元前1000年)将64卦——六维二进制空间的状态——按一种模式排列,这一模式长期困扰着学者……
Von Economo neurons (VENs) 是大型双极投射神经元,仅在具有复杂...的物种的前扣带皮层 (ACC) 和额叶岛叶中发现。
在具有多个异构加速引擎的系统级芯片(SoC)上部署深度神经网络(DNN)具有挑战性,而且大多数部署框架无法完全 …
现代 LLM 强化学习(RL)工作负载需要一个高效的 weight transfer system,以在异构计算资源上扩展训练……
代理式多模态模型的出现使系统能够主动与外部环境交互。然而,当前的代理在…
机器人操作可变形物体代表了具身学习中数据密集的范式,其中形状、接触和拓扑以相互共演的方式……
多模态混合专家(MoE)模型在视觉语言任务上取得了显著的性能。然而,我们发现了一种令人困惑的现象,称为 Seei…
Text-to-Audio-Video (T2AV) 生成正迅速成为媒体创作的核心接口,但其评估仍然碎片化。现有基准在很大程度上…
Group Relative Policy Optimization (GRPO) 已成为推动最近在多模态大型语言模型领域进展的事实上的强化学习 (RL) 目标。
Visual decoding from brain signals 是计算机视觉和神经科学交叉领域的关键挑战,需要能够桥接神经表征……
我们引入 RewardFlow,这是一种无反演框架,在推理时通过多奖励 Langevin 动力学引导预训练的 diffusion 和 flow‑matching 模型。
个人 AI 工具现在可以通过自然语言请求生成,但它们在创建后往往仍然是孤立的。我们提出了 PSI,一种共享状态的架构……
On-policy distillation (OPD) 在学生模型自身产生的分布下进行训练,同时利用更强教师的监督。我们识别出一个失败…
当今的大型语言模型(LLMs)通过强化学习等方法进行训练,以对齐用户偏好。然而,模型正开始被 d...
将 steering vectors 应用于大型语言模型(LLMs)是一种高效且有效的模型对齐技术,但我们缺乏可解释的说明。
AI agents 可能能够自动处理你的 inbox,但它们能否自动化你生活中的其他常规方面?日常在线任务提供了一个现实且尚未解决的测试…
我们在不同性约束下,开启对语言生成极限模型的研究,该模型由 Kleinberg 和 Mullinathan [KM24] 最近提出。
Prompt injection attacks 在广泛的实际应用中构成严重的安全风险。尽管受到越来越多的关注,社区仍面临……
先前的研究已经表明,基于神经网络的节点嵌入在相同数据集上使用相同参数进行训练时会产生不同的结果,ju...
可验证奖励强化学习(RLVR)显著提升了大语言模型(LLM)在数学等形式化领域的推理能力……
联邦学习(FL)实现了跨分布式航空机队的隐私保护预测性维护,但梯度通信开销限制了……
拓扑数据分析(TDA)提供了描述数据形状的工具,但将拓扑特征整合到深度学习流水线中仍然具有挑战性……
尽管在由可验证奖励强化学习(RLVR)驱动的大规模推理模型(LRMs)方面取得了显著进展,但这种范式在根本上是…
符号回归(Symbolic regression,SR)旨在从数据中发现数学表达式,这一任务传统上通过组合式的遗传编程(Genetic Programming,GP)来实现……
对于极端边缘的应用,仅有几十个人工神经元的极小网络用于离散时间信号中的事件检测和分类……
文本到图像生成执行一个以 base diffusion model 为核心的 diffusion workflow,涉及多个模型。现有的 serving 系统将每个 workflow…
Agents 是由 LLM 驱动的组件,能够以强大且任意的方式改变环境。提取在生产环境中执行 Agents 的保证……
Spatiotemporal neural dynamics 和 oscillatory synchronization 被广泛认为在 biological information processing 中起重要作用,并被假设支持……
为 NP 难组合优化问题(如车辆路径问题(VRP))设计高性能的元启发式算法仍然是一个重大挑战。
工业预测通常涉及多源异步信号和多输出目标,而部署则需要在预测…之间进行明确的权衡。
Large Chunk Test-Time Training (LaCT) 已在长上下文 3D 重建中展示了强大的性能,但其完全可塑的推理时更新仍然脆弱……
Exact relevance certification 询问在坐标结构化决策问题中,哪些坐标是确定最优行动所必需的。可处理的 fa...