长短期记忆网络,是神经网络架构的衍生,常常用于处理时序数据。

独立单元

输入部分:

  • c 表示 LSTM 的内部状态,代表了长期记忆,仅在 LSTM 内部运转
  • a 表示 LSTM 的隐藏状态,代表短期记忆
  • x 表示对单元的输入

门控部分:

  • 遗忘门 forget gate,计算对 c 的遗忘程度
  • 输入门 update gate,计算对 c 的更新
  • 输出门 output gate,计算 o 的输出值大小

直觉: LSTM 模型一并考虑了长期记忆和短期记忆,注意短期记忆在 LSTM 构成的网络中是可以流动的,而长期记忆是驻留在每个 LSTM 单元中的。

公式

应用

上图表示了 LSTM 构成的一个典型网络。用于处理时序数据。