您的位置：首页 > 运维架构 > Tomcat

Lucence的solr的安装和Tomcat的整合（带中文分词）

2016-03-29 23:43 585 查看

Solr是一个独立的企业级搜索应用服务器，它对外提供类似于Web-service的API接口。用户可以通过http请求，向搜索引擎服务器提交一定格式的XML文件，生成索引；也可以通过Http Get操作提出查找请求，并得到XML格式的返回结果。
Solr是一个高性能，采用Java5开发，基于Lucene的全文搜索服务器。同时对其进行了扩展，提供了比Lucene更为丰富的查询语言，同时实现了可配置、可扩展并对查询性能进行了优化，并且提供了一个完善的功能管理界面，是一款非常优秀的全文搜索引擎。

前提需要下载
1、solr-lucence3.5.0(solr3.5.0)
2、jdk
3、tomcat

tomcat和solr的整合需要以下几个步骤，下面用图文介绍
1、将solr中的example中的solr拷贝到要作为服务器的位置
（我这里把apache-solr-3.5.0<附件中会提到下载地址>下面的example文件夹下所有的文件夹拷贝到    D:\lucence\solr\home中，如下图）

2、将solr中的war包解压到D:\lucence\solr\server\solr中，如下图

3、修改solr->home->conf文件夹中的solrconfig.xml的内容

4、设置相应的tomcat的context（tomcat目录下conf的server.xml文件）,并未context设置相应的环境变量，说明solr的主目录的地址

![这里写图片描述](https://img-blog.csdn.net/20160329231647125)
5、取消VelocityResponseWriter这种输出格式（D:\lucence\solr\home\conf下的solrconfig.xml文件修改为false）

6、加入中文分词

6.1将中文分词的包拷贝到server的lib中(mmseg4j-all-1.8.5.jar和mmseg4j-solr-1.8.5.jar<附件会提供>拷贝到D:\lucence\solr\server\solr\WEB-INF\lib中)

6.2将中文分词添加到FieldTypez（下面内容添加到D:\lucence\solr\home\conf的schema.xml中）

<fieldType name="textComplex" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="textMaxWord" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="textSimple" class="solr.TextField" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
</analyzer>
</fieldType>

6.3、将mmseg4j-1.8.5\data下面的所有数据拷贝到D:\lucence\solr\home\dic下面

启动tomcat，运行http://localhost:8080/solr/

点击Analysis进入分词器页面，大功告成，如下图：

附件：

apache-solr-3.5.0.zip :http://download.csdn.net/detail/l1028386804/9281511

mmseg4j-1.8.5.zip :http://download.csdn.net/detail/l1028386804/9284085

有不明白和配置错误的可随时联系！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： tomcat solr lucene xml java

相关文章推荐

新的分享

章节导航