TTT-Discover 优化 GPU kernels 比人类专家快2倍——通过在推理期间训练
发布: (2026年2月6日 GMT+8 06:00)
1 min read
原文: VentureBeat
Source: VentureBeat
Overview
斯坦福大学、英伟达和 Together AI 的研究人员开发了一种新技术,能够为极其复杂的问题发现全新的解决方案。例如,他们成功地将一个关键的 GPU 核心优化,使其运行速度比之前由人工专家编写的最先进实现快 2 倍。该技术名为 TTT‑Discover,它结合了基于 Transformer 的模型和强化学习,能够自动探索可能的核心实现空间。
(文章其余部分继续详细介绍方法论、实验结果以及对未来硬件‑软件协同设计的潜在影响。)