Lucence的solr的安装和Tomcat的整合(带中文分词)
2016-03-29 23:43
585 查看
Solr是一个独立的企业级搜索应用服务器,它对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引;也可以通过Http Get操作提出查找请求,并得到XML格式的返回结果。 Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。同时对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。
前提需要下载 1、solr-lucence3.5.0(solr3.5.0) 2、jdk 3、tomcat tomcat和solr的整合需要以下几个步骤,下面用图文介绍 1、将solr中的example中的solr拷贝到要作为服务器的位置 (我这里把apache-solr-3.5.0<附件中会提到下载地址>下面的example文件夹下所有的文件夹拷贝到 D:\lucence\solr\home中,如下图)
2、将solr中的war包解压到D:\lucence\solr\server\solr中,如下图
3、修改solr->home->conf文件夹中的solrconfig.xml的内容
4、设置相应的tomcat的context(tomcat目录下conf的server.xml文件),并未context设置相应的环境变量,说明solr的主目录的地址
![这里写图片描述](https://img-blog.csdn.net/20160329231647125) 5、取消VelocityResponseWriter这种输出格式(D:\lucence\solr\home\conf下的solrconfig.xml文件修改为false)
6、加入中文分词
6.1将中文分词的包拷贝到server的lib中(mmseg4j-all-1.8.5.jar和mmseg4j-solr-1.8.5.jar<附件会提供>拷贝到D:\lucence\solr\server\solr\WEB-INF\lib中)
6.2将中文分词添加到FieldTypez(下面内容添加到D:\lucence\solr\home\conf的schema.xml中)
<fieldType name="textComplex" class="solr.TextField" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> </analyzer> </fieldType> <fieldType name="textMaxWord" class="solr.TextField" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/> </analyzer> </fieldType> <fieldType name="textSimple" class="solr.TextField" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/> </analyzer> </fieldType>
6.3、将mmseg4j-1.8.5\data下面的所有数据拷贝到D:\lucence\solr\home\dic下面
启动tomcat,运行http://localhost:8080/solr/
点击Analysis进入分词器页面,大功告成,如下图:
附件:
apache-solr-3.5.0.zip :http://download.csdn.net/detail/l1028386804/9281511
mmseg4j-1.8.5.zip :http://download.csdn.net/detail/l1028386804/9284085
有不明白和配置错误的可随时联系!
相关文章推荐
- java对世界各个时区(TimeZone)的通用转换处理方法(转载)
- java-注解annotation
- java-模拟tomcat服务器
- java-用HttpURLConnection发送Http请求.
- java-WEB中的监听器Lisener
- Android IPC进程间通讯机制
- i-jetty环境搭配与编译
- Android Native 绘图方法
- Android java 与 javascript互访(相互调用)的方法例子
- 实现单Tomcat多Server配置
- 生产环境下的Tomcat配置
- 介绍一款信息管理系统的开源框架---jeecg
- 聚类算法之kmeans算法java版本
- java实现 PageRank算法
- PropertyChangeListener简单理解
- Linux部署Tomcat服务器
- c++11 + SDL2 + ffmpeg +OpenAL + java = Android播放器