您的位置:首页 > 运维架构 > Tomcat

Lucence的solr的安装和Tomcat的整合(带中文分词)

2016-03-29 23:43 585 查看
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。
Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。




前提需要下载
1、solr-lucence3.5.0(solr3.5.0)
2、jdk
3、tomcat

tomcat和solr的整合需要以下几个步骤,下面用图文介绍
1、将solr中的example中的solr拷贝到要作为服务器的位置
(我这里把apache-solr-3.5.0<附件中会提到下载地址>下面的example文件夹下所有的文件夹拷贝到    D:\lucence\solr\home中,如下图)




2、将solr中的war包解压到D:\lucence\solr\server\solr中,如下图




3、修改solr->home->conf文件夹中的solrconfig.xml的内容




4、设置相应的tomcat的context(tomcat目录下conf的server.xml文件),并未context设置相应的环境变量,说明solr的主目录的地址




![这里写图片描述](https://img-blog.csdn.net/20160329231647125)
5、取消VelocityResponseWriter这种输出格式(D:\lucence\solr\home\conf下的solrconfig.xml文件修改为false)






6、加入中文分词

6.1将中文分词的包拷贝到server的lib中(mmseg4j-all-1.8.5.jar和mmseg4j-solr-1.8.5.jar<附件会提供>拷贝到D:\lucence\solr\server\solr\WEB-INF\lib中)

6.2将中文分词添加到FieldTypez(下面内容添加到D:\lucence\solr\home\conf的schema.xml中)

<fieldType name="textComplex" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="textMaxWord" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="textSimple" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
</analyzer>
</fieldType>




6.3、将mmseg4j-1.8.5\data下面的所有数据拷贝到D:\lucence\solr\home\dic下面



启动tomcat,运行http://localhost:8080/solr/



点击Analysis进入分词器页面,大功告成,如下图:



附件:

apache-solr-3.5.0.zip :http://download.csdn.net/detail/l1028386804/9281511

mmseg4j-1.8.5.zip :http://download.csdn.net/detail/l1028386804/9284085

有不明白和配置错误的可随时联系!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  tomcat solr lucene xml java