机器学习 “Advent Calendar” Bonus 2:Excel 中的 Gradient Descent 变体

发布: (2025年12月31日 GMT+8 19:00)
1 分钟阅读

Source: Towards Data Science

梯度下降变体

梯度下降、动量、RMSProp 和 Adam 都旨在寻找相同的最小值。它们不改变目标,只改变路径。每种方法都加入了一种机制,以修复前一种方法的局限性,使得移动更快、更稳定或更具适应性。目标保持不变。更新会…

Back to Blog

相关文章

阅读更多 »

递归语言模型

Article URL: https://arxiv.org/abs/2512.24601 Comments URL: https://news.ycombinator.com/item?id=46475395 Points: 8 Comments: 0...

🧠 LLMs 像5岁小孩一样解释

图书管理员类比 想象一位图书管理员,他:- 阅读了图书馆里的每一本书 - 记住了语言运作的模式 - 能够预测下一个词…