1周前 · ai 🧠✂️ 神经网络脑叶切除:从 LLM 中移除 7 层——速度提升 30% 对语言模型进行外科层移除的实验:我使用 TinyLlama 1.1,拥有 1 B 参数、22 个 decoder 层,并开始移除层以测试假设……