A Neural Probabilistic Language Model笔记
2017-08-30 18:16
513 查看
本文是个人笔记,lz才疏学浅,有什么理解不到位的地方欢迎各种拍 .
理解简述:
其本身是语言模型,为了验证或者说是预测一句话最可能的表达,在预测的过程中产生word embedding 矩阵,在输入层中将词映射为一个m列的向量,也即词的向量表示,NPLM模型结构一共分为3层,输入 映射-隐含-输出
模型结构图
模型训练过程
图中最低的是输入 映射层
输入是当前词w_t的前n个词 (w_t-n+1~w_t-1) 经过C matrix 映射后到了映射层,模型训练的开始C matrix可以随机初始化,在论文的原文是这样的they could be initialized using prior knowledgeof semantic features. 最终模型train后C matrix也更新。
词向量concat成矩阵
隐含层
由映射层到隐含层函数,y_t表示词w_t出现的概率
输出层
由隐含层到输出层归一化指数函数softmax,
参数:
参数迭代:
似然求参数
备注:公式中字母代表的意义请参考原论文
参考:
A Neural Probabilistic Language Model
Deep Learning in NLP (一)词向量和语言模型
理解简述:
其本身是语言模型,为了验证或者说是预测一句话最可能的表达,在预测的过程中产生word embedding 矩阵,在输入层中将词映射为一个m列的向量,也即词的向量表示,NPLM模型结构一共分为3层,输入 映射-隐含-输出
模型结构图
模型训练过程
图中最低的是输入 映射层
输入是当前词w_t的前n个词 (w_t-n+1~w_t-1) 经过C matrix 映射后到了映射层,模型训练的开始C matrix可以随机初始化,在论文的原文是这样的they could be initialized using prior knowledgeof semantic features. 最终模型train后C matrix也更新。
词向量concat成矩阵
隐含层
由映射层到隐含层函数,y_t表示词w_t出现的概率
输出层
由隐含层到输出层归一化指数函数softmax,
参数:
参数迭代:
似然求参数
备注:公式中字母代表的意义请参考原论文
参考:
A Neural Probabilistic Language Model
Deep Learning in NLP (一)词向量和语言模型
相关文章推荐
- 论文笔记:A Neural Probabilistic Language Model
- A Neural Probabilistic Language Model笔记
- NLP论文研读之路:A Neural Probabilistic Language Model
- Deep Learning 读书笔记(十二):A Neural Probabilistic Language Model
- A Neural Probabilistic Language Model
- 读论文《A Neural Probabilistic Language Model》
- A Neural Probabilistic Language Model
- 【论文阅读】A Neural Probabilistic Language Model
- Neural Probabilistic Language Model, word2vec来龙去脉
- [NLP论文阅读]A Neural Knowledge Language Model(一)
- 读论文《Recurrent neural network based language model 》
- 词嵌入(word2vec)-NNLM(Neural Network Language Model)
- 论文笔记《A Survey of Model Compression and Acceleration for Deep Neural Networks》
- [机器学习入门] 李宏毅机器学习笔记-5(Classification- Probabilistic Generative Model;分类:概率生成模型)
- An unsupervised neural attention model for aspect extraction 读论文笔记
- [论文笔记] Learning to Read Chest X-Rays Recurrent Neural Cascade Model for Automated Image Annotation
- Feedforward Neural Network Language Model(NNLM)c++核心代码实现
- [dialog system]阅读笔记 - 2016__A Persona-Based Neural Conversation Model
- Recurrent Neural Network Based Language Model(RNNLM)原理及BPTT数学推导
- 论文引介 | A Neural Knowledge Language Model