循环神经网络

循环神经网络（RNN）是一种专门处理序列数据的神经网络。其核心特点是引入“循环连接”，使网络具备记忆能力，能够利用上文信息预测后续内容。

输入：当前时刻的输入 $x_{t}$ 和前一时刻的隐藏状态 $h_{t - 1}$ 。
更新公式：
$h_{t} = σ (W_{h} h_{t - 1} + W_{x} x_{t} + b)$
- $σ$ ：激活函数（如tanh、ReLU）。
- $W_{h}, W_{x}$ ：权重矩阵； $b$ ：偏置项。
输出： $y_{t} = f (W_{y} h_{t} + c)$ ， $f$ 为输出层激活函数（如Softmax）。

时间步1: [h0] → [h1] → y1  
时间步2: [h1] → [h2] → y2  
...  
时间步T: [h_{T-1}] → [h_T] → yT

解决问题：普通RNN的梯度消失/爆炸，难以捕捉长期依赖。
核心组件：
- 遗忘门：决定丢弃哪些历史信息。
- 输入门：筛选新信息加入记忆。
- 输出门：控制当前时刻的输出。
- 细胞状态：贯穿时间线的“记忆通道”，减少信息衰减。

简化版LSTM：合并遗忘门与输入门为“更新门”，取消细胞状态。
公式：
$z_{t} = σ (W_{z} [h_{t - 1}, x_{t}]) (更新门) r_{t} = σ (W_{r} [h_{t - 1}, x_{t}]) (重置门) {\tilde{h}}_{t} = \tanh (W [r_{t} ⊙ h_{t - 1}, x_{t}]) h_{t} = (1 - z_{t}) ⊙ h_{t - 1} + z_{t} ⊙ {\tilde{h}}_{t}$

词条内容仅供参考，如果您需要解决具体问题
（尤其在法律、医学等领域），建议您咨询相关领域专业人士。

如果您认为本词条还有待完善，请编辑

关键词