理解 LSTM – 第6部分:LSTM 如何产生其最终输出
发布: (2026年3月2日 GMT+8 04:50)
2 分钟阅读
原文: Dev.to
Source: Dev.to
最终阶段:更新短期记忆
在上一篇文章中我们已经介绍了输入门;在本篇文章中我们将探讨下一个组件。
这一最终阶段会更新短期记忆。
我们先取新的长期记忆,并将其作为 tanh 激活函数的输入。把 2.96 代入 tanh 函数后,得到约 0.99。数值 0.99 代表一种潜在的短期记忆。
决定输出多少
现在 LSTM 必须决定将这段潜在的短期记忆传递多少。和前面的阶段一样,我们使用 sigmoid 激活函数来决定 LSTM 保留的比例。经过计算后得到 0.99。
创建新的短期记忆
接下来我们将这两个数值相乘:
[ \text{new short‑term memory} = 0.99 \times 0.99 \approx 0.98 ]
得到的新短期记忆为 0.98。这个数值 0.98 也是整个 LSTM 单元的最终输出。由于新的短期记忆同时也是 LSTM 单元的输出,这一步被称为 输出门。
现在我们已经了解了 LSTM 的三个阶段是如何协同工作的,接下来将在下一篇文章中用真实数据演示它们的实际运行。