谈谈CRF++的特征选取(http://nzinfo.spaces.live.com/blog/cns!67694E0B61E3E8D2!182.entry)
2008-11-17 09:47
260 查看
在CRF++中,存在特征模板的概念,通过定义模板文件中的特征模板来提取特征,进行CRF模型计算。
其特征分以下三个阶段:
1 特征模板:定义从训练集中提取特征的方法
2 特征F:使用特征模板从训练集中提取到的特征字符串,在CRF++中,这些特征都是二值函数
3 活动特征AF: 具体某个特征在某个Tag下出现的情况,af(f,tag)。
在CRF的解码过程,实际上是通过已知的F,展开成AF,并求出最可能的Tag的序列;
因为CRF++只需要写一个特征模板,使用简单。因此在NLP领域得到了广泛的应用。但是,简单的使用界面是有副作用的。
1、通过特征模板,产生了大量的无效特征,上述特征在提高计算精度上贡献有限,但是仍然占用了大量的计算时间
2、通过特征模板,难于表达复杂的特征提取逻辑。
我认为一种理想的情况是,由CRF的用户手工写程序进行特征的提取,交由CRF计算模块进行模型的评估计算。
相关文章推荐
- QT中窗口刷新事件的学习总结(http://wuguangchao.spaces.live.com/blog/cns!6F7400464FEEC42A!144.entry)
- 在ARM Linux上使用OpenGL(http://xianzilu.spaces.live.com/blog/cns!4201FDC93932DDAF!274.entry)
- 他人的笔记(二)(http://hurryguy.spaces.live.com/blog/cns!11D1743716676DEB!146.trak)
- 他人的笔记(三)(http://hurryguy.spaces.live.com/blog/cns!11D1743716676DEB!146.trak)
- 他人的笔记(六)(http://hurryguy.spaces.live.com/blog/cns!11D1743716676DEB!146.trak)
- SEH,DEP, Compiler,FS:[0], LOAD_CONFIG and PE format http://eparg.spaces.live.com/blog/cns!59BFC22C0E7E1A76!712.entry
- 他人的笔记(四)(http://hurryguy.spaces.live.com/blog/cns!11D1743716676DEB!146.trak)
- SQL锁机制高级篇http://tamsun.spaces.live.com/blog/cns!549A39619D3FADA3!177.entry
- 几种stl的实现 http://beautypiece.spaces.live.com/blog/cns!B6F09887AFB115D!240.entry
- GPU相关资料(转自http://heresy.spaces.live.com/blog/cns!E0070FB8ECF9015F!3114.entry)
- 他人的笔记(五)(http://hurryguy.spaces.live.com/blog/cns!11D1743716676DEB!146.trak)
- 他人的笔记(一)(http://hurryguy.spaces.live.com/blog/cns!11D1743716676DEB!146.trak)
- 关于Stereo Matching中的各种约束和假设(转自http://kaizitop.spaces.live.com/blog/cns!B4A21B0C2D46EC31!308.entry)
- 此处blog不再维护,欢迎访问http://sycnick.spaces.live.com/
- blog已转到 http://wangzhongwen.spaces.live.com
- http://bowlvan.spaces.live.com/blog/
- [Notice] 朋友们,blog更新http://jiang-hongfei.spaces.live.com
- blog移植到http://zadecn.spaces.live.com
- TOMCAT 主目录 与虚拟目录的配置(转自:http://passionaltowel.spaces.live.com/blog/)
- blog搬家--http://morelittle.spaces.live.com/