使用Java调用中科院分词NLPIR/ICTCLAS
2015-01-29 10:32
316 查看
官方地址:http://ictclas.nlpir.org/
1. 下载NLPIR/ICTCLAS2015分词(最新版本)地址:http://ictclas.nlpir.org/newsdownloads?DocId=389
2. 下载NLPIR-ICTCLAS2013-Win-32-JNI(u0416)地址:http://ictclas.nlpir.org/newsdownloads?DocId=354(我电脑是64位win7,用的是32位JDK和32位Eclipse,如果是64位JDK要下载64位的)
3. 下载后将两个压缩包解压
4. 创建Java工程
5. 20141230101836_ICTCLAS2015\ICTCLAS2015\bin\ICTCLAS2015中的NLPIR.dll文件复制到Java工程的跟目录
6. 20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib\中的NLPIR_JNI.dll文件复制到Java工程的跟目录
7. 再将20141230101836_ICTCLAS2015\ICTCLAS2015中Data文件夹复制到Java工程的跟目录
8. 20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib中的kevin文件夹和TestNLPIR.java复制到Java工程src目录下
9. 工程搭建完成,如图
运行TestNLPIR.java,如果按上面的步骤配置可能会报错了,查看日志发现Configure.xml文件没有找到(日志文件在工程的跟目录
yyyyMMdd.log,第一次执行需要按F5才能看见)
修改TestNLPIR.java代码31行,改成String argu = “”;即可,如果工程是UFT-8编码,需要把所有的GB2312改成UFT-8,否者会乱码
修改后的代码
修改后执行程序控制台输出:分词结果为:张华平/nr推出/v的/ude1
NLPIR/x分词/v系统/n,/wd又/d名/qICTCLAS2013/x,/wd新增/v新词/n识别/vn、/wn关键词/n提取/v、/wn微/ag博/ag分词/v功能/n。/wj
_
但最后一个字符还是乱码了,不知道为什么
错误及解决
1.Cannot Open Configure file
../../\Data\Configure.xml
找不到Configure.xml文件,修改TestNLPIR.java第31行
2.
Not valid license or your license expired! Please feelfree to contact pipy_zhang@msn.com!
下载最新的NLPIR/ICTCLAS,用新的Data文件夹覆盖旧的
配置好的工程:http://download.csdn.net/detail/itjavaer/8406103
1. 下载NLPIR/ICTCLAS2015分词(最新版本)地址:http://ictclas.nlpir.org/newsdownloads?DocId=389
2. 下载NLPIR-ICTCLAS2013-Win-32-JNI(u0416)地址:http://ictclas.nlpir.org/newsdownloads?DocId=354(我电脑是64位win7,用的是32位JDK和32位Eclipse,如果是64位JDK要下载64位的)
3. 下载后将两个压缩包解压
4. 创建Java工程
5. 20141230101836_ICTCLAS2015\ICTCLAS2015\bin\ICTCLAS2015中的NLPIR.dll文件复制到Java工程的跟目录
6. 20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib\中的NLPIR_JNI.dll文件复制到Java工程的跟目录
7. 再将20141230101836_ICTCLAS2015\ICTCLAS2015中Data文件夹复制到Java工程的跟目录
8. 20130416090224_Win-32bit-JNI-lib\Win-32bit-JNI-lib中的kevin文件夹和TestNLPIR.java复制到Java工程src目录下
9. 工程搭建完成,如图
运行TestNLPIR.java,如果按上面的步骤配置可能会报错了,查看日志发现Configure.xml文件没有找到(日志文件在工程的跟目录
yyyyMMdd.log,第一次执行需要按F5才能看见)
修改TestNLPIR.java代码31行,改成String argu = “”;即可,如果工程是UFT-8编码,需要把所有的GB2312改成UFT-8,否者会乱码
修改后的代码
修改后执行程序控制台输出:分词结果为:张华平/nr推出/v的/ude1
NLPIR/x分词/v系统/n,/wd又/d名/qICTCLAS2013/x,/wd新增/v新词/n识别/vn、/wn关键词/n提取/v、/wn微/ag博/ag分词/v功能/n。/wj
_
但最后一个字符还是乱码了,不知道为什么
错误及解决
1.Cannot Open Configure file
../../\Data\Configure.xml
找不到Configure.xml文件,修改TestNLPIR.java第31行
2.
Not valid license or your license expired! Please feelfree to contact pipy_zhang@msn.com!
下载最新的NLPIR/ICTCLAS,用新的Data文件夹覆盖旧的
配置好的工程:http://download.csdn.net/detail/itjavaer/8406103
相关文章推荐
- 使用Java调用中科院分词NLPIR/ICTCLAS
- 使用JAVA调用中科院ICTCLAS2015分词系统
- 中科院分词(ICTCLAS)Java调用接口下载
- Eclipse+Java调用中科院分词系统ICTCLAS2016
- ictclas分词系统的使用,java调用,附带连接mysql进行读写。
- ICTCLAS分词系统Java调用接口在Eclipse中的安装
- Java通过JNI调用ICTCLAS中文分词包的方法
- 中科院中文分词在java中调用详解(ICTCLAS2013版)
- JAVA WEB 中添加中科院分词系统ICTCLAS
- ICTCLAS分词系统Java调用接口在Eclipse中的安装 http://blog.csdn.net/CloneIQ/archive/2006/07/20/945909.aspx
- ICTCLAS 中科院分词 在java上的实现demo
- 中科院中文分词系统ICTCLAS如何在安卓平台上使用
- 关于使用中文分词工具ICTCLAS2013 Java版本乱码的问题
- ICTCLAS分词系统Java调用接口在Eclipse中的安装- Java编程
- NLPIR/ICTCLAS 2015 之Java接口使用以及去除词语后面的词性
- Java调用ICTCLAS2016 之中文分词
- 关于使用中文分词工具ICTCLAS2013 Java版本乱码的问题
- 使用中科院汉语分词系统ICTCLAS2009共享版(JNI)会出现的问题
- ICTCLAS2011中文分词在java的web项目中的使用
- ICTCLAS分词系统Java调用接口在Eclipse中的安装