AI efficiency | EUNO.NEWS

3小时前 · ai

AdaSPEC：用于高效投机解码器的选择性知识蒸馏

引言 AdaSPEC 是一种新方法，通过使用小型草稿模型进行初始生成阶段，然后进行验证，以加速大语言模型。

#speculative decoding #knowledge distillation #large language models #inference acceleration #draft model #AdaSPEC #AI efficiency #model compression
1天前 · ai

Nvidia 推出 Nemotron 3，采用混合 MoE 和 Mamba‑Transformer，推动高效的 agentic AI

Nvidia 推出了其前沿模型的新版本 Nemotron 3，采用了一种模型架构，全球最有价值的公司称其提供更多……

#Nvidia #Nemotron 3 #Mixture of Experts #Mamba-Transformer #agentic AI #large language models #AI efficiency