EUNO.NEWS EUNO.NEWS
  • All (21616) +193
  • AI (3240) +6
  • DevOps (956) +4
  • Software (11195) +137
  • IT (6174) +46
  • Education (51)
  • Notice
  • All (21616) +193
    • AI (3240) +6
    • DevOps (956) +4
    • Software (11195) +137
    • IT (6174) +46
    • Education (51)
  • Notice
  • All (21616) +193
  • AI (3240) +6
  • DevOps (956) +4
  • Software (11195) +137
  • IT (6174) +46
  • Education (51)
  • Notice
Sources Tags Search
한국어 English 中文
  • 2天前 · ai

    理解梯度爆炸问题

    为什么神经网络会爆炸——一个帮助训练的简单修复 一些神经网络,尤其是RNN,在训练时可能感觉像在风暴中驾驶船只,因为微小的…

    #exploding gradients #gradient clipping #RNN #neural networks #training stability #deep learning
  • 1个月前 · ai

    NeurIPS 2025 最佳论文评审:Qwen 的注意力门控系统性探索

    这个小技巧可以提升训练的稳定性,使用更大的学习率,并改善可扩展性。The post NeurIPS 2025 Best P...

    #NeurIPS 2025 #attention gating #Qwen #training stability #large learning rates #scaling properties #deep learning #transformers
EUNO.NEWS
RSS GitHub © 2026