理解 LSTM – 第7部分:使用真实数据的 LSTM 实战
发布: (2026年3月4日 GMT+8 05:06)
3 分钟阅读
原文: Dev.to
Source: Dev.to
引言
在上一篇文章中,我们完成了 LSTM 的三个阶段:遗忘门、输入门和输出门。
现在,让我们使用真实数据来运行 LSTM。
数据概览
- 公司
- 公司 A
- 公司 B
- 坐标轴
- Y 轴: 股票价值
- X 轴: 记录价值的日期
当两家公司的数据重叠时,唯一的差异出现在 第 1 天 和 第 5 天 之间。
公司 A 的 LSTM 处理
我们将 第 1 天 到 第 4 天 的数据依次输入展开的 LSTM,观察它是否能够正确预测 第 5 天 的价值。
- 初始化 长期记忆和短期记忆为零。
- 使用简化示意图(定期显示)保持清晰的概览。
第 1 天
- 输入值:
0 - 计算后:
- 新的长期记忆:(C_1 = -0.20)
- 新的短期记忆:(h_1 = -0.13)
第 2 天、 第 3 天、 第 4 天
- 将当天的值代入并重复相同的过程。
处理完 第 4 天 后,最终的短期记忆为:
[ h_4 = 0 ]
这意味着展开的 LSTM 输出正确预测了 公司 A 在 第 5 天 的价值。
公司 B 的 LSTM 处理
我们使用 公司 B 的数值重复完全相同的过程。
在将 第 1 天 到 第 4 天 依次输入 LSTM 后,最终的短期记忆为:
[ h_4 = 1 ]
这正确预测了 公司 B 在 第 5 天 的价值。
结论
本篇文章结束了我们对 LSTM 的讨论。接下来的文章我们将转向 词嵌入(Word Embeddings) 和 Word2Vec。
Installerpedia
想要更轻松地安装工具、库或整个代码仓库吗?
Installerpedia 是一个社区驱动、结构化的安装平台,让你几乎可以毫不费力、并且得到清晰可靠的指导来安装任何东西。
ipm install repo-name
… 完成! 🚀