您的位置:首页 > 运维架构

OpenNLP学习笔记1

2016-09-03 21:01 232 查看
我是在学习OpenEphyra这个开源对话系统时,遇到了OpenNLP的运行错误,才开始学习OpenNLP的.

学习怎么使用OpenNLP最简单的方法是命令行下调用,以下测试是在win7下进行的.

1. 从官网上下载了apache-opennlp-1.6.0-bin包,从其他网上下载了英语分词的模型文件en-token.bin,放到bin文件夹下.

一个简单的命令行下的英语分词示例如下图(window下执行的是bin文件夹下的批处理文件opennlp.bat, OpenNLP的jar文件是lib\opennlp-tools-1.6.0.jar):



2. 从官网上下载了apache-opennlp-1.6.0-src包,这个是源代码包, 包含以下4个文件夹:



我的目的是使用Eclipse根据opennlp-tools编译出jar文件.在Eclipse创建新的Java Project后, Import "opennlp"的上一层文件夹(此处新手要注意文件夹层次关系,否则编译出错).

编译发现"import org.osgi.framework.BundleActivator"有个错误,但不影响生成jar文件及后续简单的测试.

3. 这样生成opennlp-tools-1.6.0.jar文件后,把该文件拷贝到apache-opennlp-1.6.0-bin\apache-opennlp-1.6.0\lib中替换掉原始的opennlp-tools-1.6.0.jar文件,在命令行下进行1.中的测试,出现了以下的错误:



通过网上搜索[1],发现生成的jar压缩文件中的MANIFEST.MF文件缺失了Main-Class定义,于是增加了以下的定义后,以上的批处理运行正常了.

Main-Class: opennlp.tools.cmdline.CLI

参考:

[1] http://jingyan.baidu.com/article/db55b60990f6084ba30a2fb8.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: