总结

本文主要讲了N vs N，N vs 1、1 vs N、N vs M四种经典的RNN模型，以及如何使用Attention结构。

从单层网络谈起

在学习RNN之前，首先要了解一下最基本的单层网络，它的结构如图：

单层网络

输入是x，经过变换Wx+b和激活函数f得到输出y

在实际应用中，我们还会遇到很多序列形的数据：

0(1).jpeg

序列形的数据

如：

序列形的数据就不太好用原始的神经网络处理了。

为了建模序列问题，RNN引入了隐状态h（hidden state）的概念，h可以对序列形的数据提取特征，接着再转换为输出。

先从h1的计算开始看：