一个使用WordNet比较词语相似度的Java包——JWS(Java WordNet Similarity)
2011-04-13 16:13
751 查看
JWS是WordNet::Similarity(一个Perl版的WordNet相似度比较包)的Java实现版本,想用Java实现用WordNet比较词语相似度的朋友有福拉!!简述使用步骤:
1、下载WordNet(Win、2.1版):http://wordnet.princeton.edu/wordnet/download/;
2、下载WordNet-InfoContent(2.1版):http://wn-similarity.sourceforge.net/ 或 http://www.d.umn.edu/~tpederse/Data/;
3、下载JWS(现有版本:beta.11.01):http://www.cogs.susx.ac.uk/users/drh21/;
4、安装WordNet;
5、解压WordNet-InfoContent-2.1,并将文件夹拷贝至WordNet目录D:/Program Files/WordNet/2.1下;
6、将JWS中的两个jar包:edu.mit.jwi_2.1.4.jar和edu.sussex.nlp.jws.beta.11.jar拷贝至Java的lib目录下,并设置环境变量;
7、在Eclipse下运行JWS中的例子程序:TestExamples
说明:由于下载的WordNet是2.1版本的,所以程序中有几处需要修改
String dir = "C:/Program Files/WordNet"; //这里指定WordNet的安装路径,按照你实际安装的路径加以修改
JWS ws = new JWS(dir, "3.0"); //把3.0改为2.1即可
8、例子运行结果:
Loading modules
set up:
... finding noun and verb <roots>
... calculating IC <roots> ...
... ICFinder
... DepthFinder
... PathFinder
... JiangAndConrath
... Lin
... Resnik
... Path
... WuAndPalmer
... Adapted Lesk : all relations
... Adapted Lesk (1)
... Adapted Lesk (2)
... HirstAndStOnge
... LeacockAndChodorow
... calculating depths of <roots> ...
Java WordNet::Similarity using WordNet 2.1 : loaded
Jiang & Conrath
apple#n#1,banana#n#1 0.04658846107981151
apple#n#1,banana#n#2 0.13115409462626942
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0
specific pair = 0.04658846107981151
highest score = 0.13115409462626942
Lin
apple#n#1,banana#n#1 0.11802556069890623
apple#n#1,banana#n#2 0.6867056880240358
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0
specific pair = 0.11802556069890623
highest score = 0.6867056880240358
具体还在学习中,先记录这些,权当笔记了。
1、下载WordNet(Win、2.1版):http://wordnet.princeton.edu/wordnet/download/;
2、下载WordNet-InfoContent(2.1版):http://wn-similarity.sourceforge.net/ 或 http://www.d.umn.edu/~tpederse/Data/;
3、下载JWS(现有版本:beta.11.01):http://www.cogs.susx.ac.uk/users/drh21/;
4、安装WordNet;
5、解压WordNet-InfoContent-2.1,并将文件夹拷贝至WordNet目录D:/Program Files/WordNet/2.1下;
6、将JWS中的两个jar包:edu.mit.jwi_2.1.4.jar和edu.sussex.nlp.jws.beta.11.jar拷贝至Java的lib目录下,并设置环境变量;
7、在Eclipse下运行JWS中的例子程序:TestExamples
说明:由于下载的WordNet是2.1版本的,所以程序中有几处需要修改
String dir = "C:/Program Files/WordNet"; //这里指定WordNet的安装路径,按照你实际安装的路径加以修改
JWS ws = new JWS(dir, "3.0"); //把3.0改为2.1即可
8、例子运行结果:
Loading modules
set up:
... finding noun and verb <roots>
... calculating IC <roots> ...
... ICFinder
... DepthFinder
... PathFinder
... JiangAndConrath
... Lin
... Resnik
... Path
... WuAndPalmer
... Adapted Lesk : all relations
... Adapted Lesk (1)
... Adapted Lesk (2)
... HirstAndStOnge
... LeacockAndChodorow
... calculating depths of <roots> ...
Java WordNet::Similarity using WordNet 2.1 : loaded
Jiang & Conrath
apple#n#1,banana#n#1 0.04658846107981151
apple#n#1,banana#n#2 0.13115409462626942
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0
specific pair = 0.04658846107981151
highest score = 0.13115409462626942
Lin
apple#n#1,banana#n#1 0.11802556069890623
apple#n#1,banana#n#2 0.6867056880240358
apple#n#2,banana#n#1 0.0
apple#n#2,banana#n#2 0.0
specific pair = 0.11802556069890623
highest score = 0.6867056880240358
具体还在学习中,先记录这些,权当笔记了。
相关文章推荐
- 一个使用WordNet比较词语相似度的Java包——JWS(Java WordNet Similarity)
- 【转】 一个使用WordNet比较词语相似度的Java包——JWS(Java WordNet Similarity)
- WordNet词网研究7——之JWS(Java Wordnet Similarity)语义相似度计算
- WordNet词网研究7——之JWS(Java Wordnet Similarity)语义相似度计算
- WordNet词网研究7——之JWS(Java Wordnet Similarity)语义相似度计算
- Java得到一个整数的绝对值,不使用任何判断和比较语句,包括API
- asp.net对word文档进行修改 对于使用word文档做模板编辑比较适用
- 词语相似度计算:1、安装NLTK和下载WordNet语料库;WordNet的使用
- 使用java将多种类型的文件如Word、PDF、JPG汇总到一个文档中(Word或者PDF)
- 如何使用Java程序打开一个Word文档?
- Java WordNet Similarity
- java使用compareTo实现一个类的对象之间比较大小
- Java得到一个整数的绝对值,不使用任何判断和比较语句,包括API
- Java得到一个整数的绝对值,不使用任何判断和比较语句,包括API.
- WordNet--JWI( the MIT Java Wordnet Interface) 获取信息
- Java得到一个整数的绝对值,不使用任何判断和比较语句,包括API.
- 针对WebService使用Service类获取Port类的一个参数问题(java.net.MalformedURLException)
- atitit.提升开发效率---使用服务器控件生命周期 asp.net 11个阶段 java jsf 的6个阶段比较
- atitit.提升开发效率---使用服务器控件生命周期 asp.net 11个阶段 java jsf 的6个阶段比较