理解 LSTM – 第6部分:LSTM 如何产生其最终输出

发布: (2026年3月2日 GMT+8 04:50)
2 分钟阅读
原文: Dev.to

Source: Dev.to

最终阶段:更新短期记忆

在上一篇文章中我们已经介绍了输入门;在本篇文章中我们将探讨下一个组件。

这一最终阶段会更新短期记忆。
我们先取新的长期记忆,并将其作为 tanh 激活函数的输入。把 2.96 代入 tanh 函数后,得到约 0.99。数值 0.99 代表一种潜在的短期记忆。

决定输出多少

现在 LSTM 必须决定将这段潜在的短期记忆传递多少。和前面的阶段一样,我们使用 sigmoid 激活函数来决定 LSTM 保留的比例。经过计算后得到 0.99。

创建新的短期记忆

接下来我们将这两个数值相乘:

[ \text{new short‑term memory} = 0.99 \times 0.99 \approx 0.98 ]

得到的新短期记忆为 0.98。这个数值 0.98 也是整个 LSTM 单元的最终输出。由于新的短期记忆同时也是 LSTM 单元的输出,这一步被称为 输出门

现在我们已经了解了 LSTM 的三个阶段是如何协同工作的,接下来将在下一篇文章中用真实数据演示它们的实际运行。

0 浏览
Back to Blog

相关文章

阅读更多 »

本月我学到的机器学习经验

markdown 二月随想 有时是二十九天。那就是二月:一个短的月份。大约四个标准周。大约二十个工作日。宏观来看,…