让盘古分词支持最新的Lucene.Net 3.0.3
2015-06-26 14:37
239 查看
原文:让盘古分词支持最新的Lucene.Net 3.0.3好多年没升级过的Lucene.Net最近居然升级了,到了3.0.3后接口发生了很大变化,原来好多分词库都不能用了,所以上次我把MMSeg给修改了一下支持了Lucene.Net 3.0.3(参考《基于MMSeg算法的中文分词类库》)。
然后我知道了.Net下还有一个盘古分词(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,网上也不少人在问,于是就下载了它的最新代码,基于Lucene.Net 3.0.3更新了,顺便把它的词库给放到dll里面了,不然每次还要拷贝一个Dictionaries目录真麻烦。另外打包放到了Nuget上,方便下载。
https://github.com/JimLiu/Lucene.Net.Analysis.PanGu
另外对比了一下MMSeg和Pangu,发现各有优缺点,没有做特别深入的比较,先用MMSeg好了。
然后我知道了.Net下还有一个盘古分词(http://pangusegment.codeplex.com/),但也不支持Lucene.Net 3.0.3,网上也不少人在问,于是就下载了它的最新代码,基于Lucene.Net 3.0.3更新了,顺便把它的词库给放到dll里面了,不然每次还要拷贝一个Dictionaries目录真麻烦。另外打包放到了Nuget上,方便下载。
https://github.com/JimLiu/Lucene.Net.Analysis.PanGu
另外对比了一下MMSeg和Pangu,发现各有优缺点,没有做特别深入的比较,先用MMSeg好了。
相关文章推荐
- 《算法:C语言实现》阅读笔记
- 二维符号库的制作总结
- windows 10系统怎么设置图形密码?
- 个人笔记小记,about network of android
- Java基础面试题
- 黑马程序员_0基础黑马路
- android 开发赚钱
- 什么是 WSGI -- Python 中的 “CGI” 接口简介
- 运行及总结
- ARC的实现机制
- msvc2010生成的指令序列有问题,可能跟pgo有关
- Python Django开发 1
- UFLDL Exercise:Self-Taught Learning
- Deep Learning(深度学习)学习笔记整理系列之(六)
- 关于cpu和numa
- 学习日记-C语言结构体(struct)
- Java中的泛型使用详细介绍
- Java collection
- 第十二届浙江省大学生程序设计大赛-Capture the Flag
- linux 命令之 last