[论文] TritonForge:基于性能分析的自动化 Triton 内核优化框架
高性能 GPU kernel 优化仍然是现代机器学习工作负载中一项关键但劳动密集的任务。虽然 Triton,这个领域特定的…
高性能 GPU kernel 优化仍然是现代机器学习工作负载中一项关键但劳动密集的任务。虽然 Triton,这个领域特定的…
我们将最近的 256 SSE 向量工作扩展到 512 AVX,实现了四倍加速。我们使用 MAGPIE(Machine Automated General Performance Improvement via Evolution of ...)。
基于大型语言模型(LLMs)的 Agentic AI 系统在自动化复杂工作流方面具有巨大的潜力,涵盖从软件开发到客户支持等领域。
最近在 diffusion transformers 方面的进展使视频生成模型能够从文本或图像生成高质量的视频片段。然而,world model...
新视角合成(Novel View Synthesis,NVS)传统上依赖于具有显式3D归纳偏置的模型,并结合来自Structure-from-Motion的已知相机参数……
理解并重建来自 video 的动态场景的复杂几何和运动仍然是 computer vision 中的一项艰巨挑战。本文介绍…
我们引入了两个新的基准 REST 和 REST+(Render-Equivalence Stress Tests),以实现对多模态大型模型中跨模态不一致性的系统评估。
文本感知图像恢复(TAIR)旨在从包含退化文本内容的低质量输入中恢复高质量图像。虽然扩散模型……
人类视频演示为学习机器人策略提供了丰富的训练数据,但仅靠视频无法捕捉对 mast... 至关重要的丰富接触信号。
量子误差校正(QEC)解码面临着一个基本的准确性‑效率权衡。像最小权重完美匹配(MWPM)这样的经典方法表现出……
夜间环境对基于相机的感知构成了重大挑战,因为现有方法被动地依赖场景光照。我们引入 Lighting-...
在 empirical software engineering (SE) 研究中,研究人员在决定如何处理数据、使用何种操作化以及选择哪些……方面拥有相当大的自由。
从单张图像生成高质量、纹理化的 3D 场景仍然是视觉和图形学中的一个根本性挑战。最近的 image-to-3D 生成器能够恢复 re...
内容感知布局生成是图形设计自动化中的关键任务,专注于创建视觉上吸引人的元素排列,使其无缝……
机器学习(ML)为发现可持续聚合物材料提供了一条强有力的途径,但由于缺乏大规模、高质量的……,进展受限。
Kernel density estimation 是机器学习、Bayesian inference、stochastic dynamics 和 signal processing 等众多算法的关键组成部分……
虽然 Large Language Models (LLMs) 的 scaling laws 传统上侧重于 proxy metrics 如 pretraining loss,但预测 downstream task performance 一直是……
检索增强生成(RAG)通过将输出基于检索到的证据进行 grounding,提升了大语言模型(LLMs)的事实性,但忠实性仍可能出现失败……
Visual reasoning 具有挑战性,需要精确的 object grounding 并理解复杂的 spatial relationships。现有方法分为两大类:...
旋转不变性对于无人机航拍影像中的精确对象级分割至关重要,因为目标可能具有任意方向并呈现细微的…
工业维护正被 Internet of Things 和 edge computing 改造,产生连续的数据流,需要实时、适应性的决策……
space AI 的崛起正通过灾害检测、边境监视和气候监测等应用,重塑政府和产业,...
视觉语言模型(VLMs)正崭露头角,成为遥感领域强大的通用工具,能够在多样任务中整合信息并实现……
真实世界的数据集通常表现出随时间变化的动态特征,其特征是数据分布的演变。忽视这种现象,通常称为概念…