长短期记忆网络,是神经网络架构的衍生,常常用于处理时序数据。
独立单元
输入部分:
- c 表示 LSTM 的内部状态,代表了长期记忆,仅在 LSTM 内部运转
- a 表示 LSTM 的隐藏状态,代表短期记忆
- x 表示对单元的输入
门控部分:
- 遗忘门 forget gate,计算对 c 的遗忘程度
- 输入门 update gate,计算对 c 的更新
- 输出门 output gate,计算 o 的输出值大小
直觉: LSTM 模型一并考虑了长期记忆和短期记忆,注意短期记忆在 LSTM 构成的网络中是可以流动的,而长期记忆是驻留在每个 LSTM 单元中的。
公式
应用
上图表示了 LSTM 构成的一个典型网络。用于处理时序数据。