本文主要讲了N vs N,N vs 1、1 vs N、N vs M四种经典的RNN模型,以及如何使用Attention结构。
在学习RNN之前,首先要了解一下最基本的单层网络,它的结构如图:
单层网络
输入是x,经过变换Wx+b和激活函数f得到输出y
在实际应用中,我们还会遇到很多序列形的数据:
序列形的数据
如:
序列形的数据就不太好用原始的神经网络处理了。
为了建模序列问题,RNN引入了隐状态h(hidden state)的概念,h可以对序列形的数据提取特征,接着再转换为输出。
先从h1的计算开始看: