笔记-2003-Chinese Word Segmentation as Character Tagging
2012-11-06 17:54
197 查看
Chinese Word Segmentation as Character Tagging
不知道这篇是不是上一篇的扩写,发表在不同杂志上
作者:Nianwen Xue
单位:Inst. for Research in Cognitive Science
出处:Computational Linguistics and Chinese Language Processing Vol. 8, No. 1, February 2003, pp.29-48 The Association for Computational Linguistics and Chinese Language Processing
主要内容:LL,LR,MM,RR;要解决MEMM的转移概率的问题
这篇论文报告了中文分词使用有监督机器学习方法的效果。训练语料由人工标注完成,效果 P 95.01%,R 94.94,训练语料大小237K。
找分词边界不是问题,问题是找到无歧义的分词边界。
由此我们可以看到,Xue在写这篇论文时,其实目的是为了解决歧义。捎带解决OOV。但是,实验中却强调了OOV,以至于后来的论文,这种字序列的学习方法都用于解决OOV
文章重点强调了分词歧义的问题。论文中提到大篇幅提到三种分词歧义,一个是交搭歧义、二是组合歧义、三是因为语义理解产生的歧义(也是组合),用一段说明了OOV的影响。
FMM会因为OOV的增加急剧下降,但是MEMM没有。
标记是 LL,LR,MM,RR
不知道这篇是不是上一篇的扩写,发表在不同杂志上
作者:Nianwen Xue
单位:Inst. for Research in Cognitive Science
出处:Computational Linguistics and Chinese Language Processing Vol. 8, No. 1, February 2003, pp.29-48 The Association for Computational Linguistics and Chinese Language Processing
主要内容:LL,LR,MM,RR;要解决MEMM的转移概率的问题
这篇论文报告了中文分词使用有监督机器学习方法的效果。训练语料由人工标注完成,效果 P 95.01%,R 94.94,训练语料大小237K。
找分词边界不是问题,问题是找到无歧义的分词边界。
由此我们可以看到,Xue在写这篇论文时,其实目的是为了解决歧义。捎带解决OOV。但是,实验中却强调了OOV,以至于后来的论文,这种字序列的学习方法都用于解决OOV
文章重点强调了分词歧义的问题。论文中提到大篇幅提到三种分词歧义,一个是交搭歧义、二是组合歧义、三是因为语义理解产生的歧义(也是组合),用一段说明了OOV的影响。
FMM会因为OOV的增加急剧下降,但是MEMM没有。
标记是 LL,LR,MM,RR
相关文章推荐
- 笔记-2003-Chinese Word Segmentation as LMR Tagging
- 笔记-2006-Subword-based Tagging by Conditional Random Fields for Chinese Word Segmentation
- 笔记-2004-Adaptive Chinese Word Segmentation
- 笔记-2003-A Maximum Entropy Chinese Character-Based Parser
- 笔记-2004-2007-A Hybrid Approach to Word Segmentation and POS Tagging
- 笔记-2012-Unsupervized Word Segmentation the case for Mandarin Chinese
- 笔记-2002-Combining Classifiers for Chinese Word Segmentation
- 笔记-2009-An Error-Driven Word-Character Hybrid Model for Joint CWS and POS Tagging
- 云寻觅中文分词 (Yunxunmi Chinese Word Segmentation) ,词汇440万,10万字文章分词并计算频率不超过1秒
- 从中文分词到动态路由(Chinese Word Segmentation===>Dynamic Routing)
- 搜索引擎之中文分词(Chinese Word Segmentation)简介
- 论文笔记:Segmentation as Selective Search for Object Recognition(ICCV2011)
- 笔记-2011-A New Unsupervised Approach to Word Segmentation
- 外文翻译_Chinese Word Segmentation at Peking University
- 《Joint segmentation and NER using dual decomposition in Chinese discharge summaires》——笔记
- 搜索引擎之中文分词(Chinese Word Segmentation)简介
- 外文翻译_A Search-based Chinese Word Segmentation Method
- 【论文阅读笔记】Segmentation as Selective Search for Object Recognition
- 搜索引擎之中文分词(Chinese Word Segmentation)简介
- 开源:云寻觅中文分词 (Yunxunmi Chinese Word Segmentation) ,词汇440万,10万字文章分词并计算频率不超过1秒