中文分词的一些心得体会
2010-11-11 15:49
302 查看
一些概念:
单纯使用正向最大匹配的错误率是1/169,单纯使用逆向最大匹配的错误率为1/245,逆向匹配的切分精度略高于正向匹配,遇到的歧义现象也比较少。
来源:
[3] Steele R,Lee C C,Gould P.GSM,edmaone and 3G Systems[M].[s.1.]:John Wiley&Sons Ltd,2001.
[4]Homnan B,Bebjapolakul W.QoS—controlling soft handof based on simple step control and a fuzzy inference systems with the gradient descent method[J].IEEE Transactions Vehicular Technology,2004,53(3):820—834.
中文分词的难点:
1. 歧义词问题
2. 未登录词识别问题
单纯使用正向最大匹配的错误率是1/169,单纯使用逆向最大匹配的错误率为1/245,逆向匹配的切分精度略高于正向匹配,遇到的歧义现象也比较少。
来源:
[3] Steele R,Lee C C,Gould P.GSM,edmaone and 3G Systems[M].[s.1.]:John Wiley&Sons Ltd,2001.
[4]Homnan B,Bebjapolakul W.QoS—controlling soft handof based on simple step control and a fuzzy inference systems with the gradient descent method[J].IEEE Transactions Vehicular Technology,2004,53(3):820—834.
中文分词的难点:
1. 歧义词问题
2. 未登录词识别问题
相关文章推荐
- 解决Linux下Oracle中文乱码的一些心得体会 ,转自
- 关于Hiberante存储CLOB的一些心得体会
- 写布局的一些心得体会续更~
- VC8.0中的一些心得体会——打开位图
- 项目架构搭建的一些心得体会 推荐
- 中文分词的一些研究记录[转]
- 大学中的一些心得体会——写给学弟学妹
- VHDL编程的一些心得体会
- 关于NSTask使用的一些心得体会
- PHPCMS V9使用中的一些心得体会
- 学习Xhtml+CSS2的一些心得体会
- 干货总结中,稍候分享一些自己的心得体会。
- 撰写863以及各种基金类技术文档的一些心得体会
- Maven 的一些心得体会
- 选购国外虚拟主机的一些心得体会
- 学习Xhtml+CSS2的一些心得体会
- 一些有关中文分词的资源
- 选购国外虚拟主机的一些心得体会
- 《.NET大局观》的一些阅读感悟与心得体会
- 关于对vuex使用过程中的一些心得体会