您的位置：首页 > 其它

NLP深度学习 —— CS224学习笔记12

2017-09-02 23:49 369 查看

1.2 语法松绑SU-RNN

不同类别输入的最优W不同。

对学习W的工作量加大，但性能提升。

现在模型受输入的语法类别条件约束。

我们决定类别的方法是通过一个简单的Probabilistic Context Free Grammar PCFG，通过计算Penn Tree Bank的统计摘要习得。例如The永远是DT.

我们初始化相同的W，默认是平均两个输入的向量。慢慢的模型学习到哪个向量更重要，以及旋转或缩放向量是否能提高性能。

例如DT-NP规则，会更重视名词而不是修饰它的定冠词。

SU-RNN超过此前的模型，但表达性仍然不够。

例如副词被定义为用于强调。如果我们只进行线性插值无法用一个向量来强调另一个向量，无法对其进行缩放。

1.3 MV-RNN 矩阵-向量递归神经网络

词表征不仅包括一个向量，也包括一个矩阵。

这样我们不仅能得到词的意义，也能学习它修饰另一个词的方法。