您的位置:首页 > 运维架构 > Tomcat

solr4.5部署到tomcat以及solr4.5配置中文分词器mmseg4j

2016-06-15 11:00 711 查看
solr4.5部署到tomcat

solr默认自带了jetty服务器,但我们习惯了tomcat,我们通过以下步骤将solr部署到tomcat

1、solr.4.5.0.zip解压到指定的目录中,如d:/solr-4.5.0

2、将d:/solr-4.5.0/example/webapps下的solr.war拷贝到tomcat–>weapps中

3、新建文件夹d:/sorl_home,将d:/solr-4.5.0/example/solr目录拷贝至d:/sorl_home中

4、启动tomcat,此时tomcat会把solr.war进行解压,生成一个solr文件夹;停止tomcat,删除solr.war。

5、用编辑器打开tomcat下面的solr/WEB-INF/web.xml,找到下面的代码:
 <!--
    <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/put/your/solr/home/here</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
  -->


打开注释,修改成
<env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/solr_home/solr</env-entry-value><!--此处为solr home的地址,在第三步中我们放置到D:/solr_home/solr-->
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>


6、启动tomcat,访问:http://localhost:8080/solr

 

本文出自 luoshengsha.com,转载时请注明出处及相应链接。

本文永久链接: http://www.luoshengsha.com/139.html

solr4.5配置中文分词器mmseg4j

solr4.x虽然提供了分词器,但不太适合对中文的分词,给大家推荐一个中文分词器mmseg4j

mmseg4j的下载地址:https://code.google.com/p/mmseg4j/

通过以下几步就可以把mmseg4j分词器集成到solr中:

1、解压mmseg4j-1.9.1.zip,把dist下面的所有jar文件拷贝到你应用服务器下的solr/WEB-INF/lib中(如果你的应用服务器下面没有solr,请参考《solr部署到tomcat》)。

2、拷贝data到solr_home/solr中(与core文件平级),并改名为dic(请参考《solr部署到tomcat》)

3、进入到你想使用mmseg4j分词器的core中(此处以solr自带的collection1为例),用编辑器打开collection1/conf/schema.xml配置文件,添加如下代码:
<!-- mmseg4j分词器 -->
<fieldType name="text_mmseg4j" class="solr.TextField" >
<analyzer type="index">
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="../dic" /><!--此处为分词器词典所处位置-->
</analyzer>
<analyzer type="query">
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="../dic" /><!--此处为分词器词典所处位置-->
</analyzer>
</fieldType>


4、引用mmseg4j分词器

上面我们已经定义了mmseg4j分词器,如何引用呢?

用编辑器打开collection1/conf/schema.xml配置文件,找到<fields>…</fields>,修改需要使用中文分词的字段,type=”text_mmseg4j”
<fields>
.......//省略
<field name="name" type="text_mmseg4j" indexed="true" stored="true" />
</fields>


通过以上步骤就可以成功配置mmseg4j分词器到solr中了。

 

本文出自 luoshengsha.com,转载时请注明出处及相应链接。

本文永久链接: http://www.luoshengsha.com/170.html

不过我按照这个配还是有问题,完整的“solr4.8.1部署到tomcat8.0.33”请看我的另一篇博客http://blog.csdn.net/ehcoing/article/details/51682145
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  solr tomcat mmseg4j