您的位置:首页 > 其它

Lstm基础学习

2020-07-14 06:30 330 查看

lstm原理

lstm

长短期记忆网络,是一种时间递归神经网络(是一种改进之后的循环神经网络),适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在原始RNN基础之上增加状态保存,来保存长期的状态。

输入

在某一时刻,每一个“细胞”又三个输入值:当前时刻网络的输入值,上一时刻的输出值,以及上一时刻单元状态。

输出

在某一时刻,lstm有两个输出值:当前时刻的输出值和当前时刻的状态,作为下一时刻的输入值。

遗忘门

决定了上一时刻的单元状态有多少保留到当前时刻

a< t-1>:t-1时刻的输出
x< t >:t时刻本层的输入
wf:变量的权重
bf:偏执项
Ff:介于0-1,1:完全保留,0:完全舍弃

输入门

决定了当前时刻网络的输入有多少保存到单元状态
tanh双曲正切激励函数和Fu共同决定什么样的新信存入状态中

最终通过遗忘门遗忘部分旧信息
确定什么样的信息放入状态中

输出门

控制单元状态有多少输出到 LSTM 的当前输出值

(引用图片说明)

门机制是让信息选择式通过的方法,通过sigmoid函数和点乘操作实现。sigmoid取值介于0~1之间,点乘则决定了传送的信息量(每个部分有多少量可以通过),当sigmoid取0时表示舍弃信息,取1时表示完全传输(即完全记住)。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: