关于 小叮咚中文分词 .net版本发布的变化
2005-05-29 21:55
447 查看
关于 小叮咚中文分词 .net版本发布的变化
现在几乎每天都有朋友给我写信,要求交流小叮咚中文分词的实现。我现在实现的有java和C#两个版本。同样的算法逻辑,用java 和 C#写两边可不是有趣的事情 。于是自然而然想起了
关于lucene发展和多语言实现的方向
中采用的方法,于是决定以后主要更新java版本的中文分词算法,而.net版本的中文分词则在java class基础上转化过来。
很早的时候我的一篇blog介绍过:基于.NET的Java虚拟机IKVM介绍
。于是今天就尝试了一把,整个过程还算顺利。下面是我的转换过程:
X:\ikvmbin-0.14.0.1\ikvm\bin>ikvmc -target:library
X:\XXXX\chinese_sentence_splitter.jar
Note: output file is "chinese_sentence_splitter.dll"
Note: automatically adding reference to "e:\programming\java&.net\ikvmbin-0.14.0.1\ikvm\bin\ikvm.gnu.classpath.dll"
通过上面的命令可以把 java jar 文件转换成 同名的 .net dll。
在java中测试的结果如下:
但在.net中测试的结果却不正确:
这很显然是IKVM.NET在转换过程中出现了问题。
由于第一次使用IKVM.NET,因此这个问题还需要在以后有时间解决一下。也希望有相关经验的朋友多多指导.
相关连接:
多么乐
小叮咚中文分词
相关文章推荐
- 小叮咚 中文分词 发布 java 版本 , c# 版本 , c++ 版本
- 发布 .Net 版本的小叮咚中文分词Web Service
- Lucene中文分词 庖丁解牛 2.0.0版本发布
- 上周末把Css中文手册 + 2天驾驭div+css(全新发布2.0.1版本).pdf看完了.强烈推荐2天驾驭div+css(全新发布2.0.1版本).pdf
- 关于版本管理和发布
- 关于iOS7以后版本企业发布问题
- Visual Studio “Orcas” Beta 2 开始发布多语种版本 包含简体中文
- Oracle新手笔记(2) 关于Oracle 9i或9i以上版本客户端连接Oracle 8i及8i版本以下服务器端中文字符乱码的解决办法
- eclipse 3.7.2版本关于中文字体显示不正常的原因及解决方法
- Visual Studio “Orcas” Beta 2 开始发布多语种版本 包含简体中文
- Windows Phone SDK 7.1 中文版本发布
- 关于Buffered在ExtJS各版本中变化
- 关于使用中文分词工具ICTCLAS2013 Java版本乱码的问题
- php-redis中文帮助手册CHM版本制作完成~~发布下载地址了
- Ubuntu中文输入法ibus-pinyin 1.3.7稳定版本发布,支持注音模式
- 关于发布后中文标注显示为小方框的解决办法
- 【转】关于Oracle 9i或9i以上版本客户端连接Oracle 8i及8i版本以下服务器端中文字符乱码的解决办法
- MSDN最新的2007年6月的中文版本发布了
- 关于ClickOnce 发布过程中的错误:要求高版本的CAPICOM.dll
- 关于wincvs1.3中文版对比版本中文乱码的解决方案