您的位置:首页 > 运维架构 > Tomcat

solr-4.10.0、tomcat7、IKAnalyzer2012FF_u1中文分词器相整合以及相关配置

2016-01-25 12:21 471 查看

=============solr-4.10.0跟tomcat7整合以及相关配置=============

1、将solr文件中的example文件下的solr目录中所有文件拷贝到自己在磁盘中创建的文件夹中

(最好创建成 盘符:\solr\home文件下)

2、将solr文件中的example文件下的webapps目录中solr.war文件拷贝到自己在磁盘中创建的盘符:\solr\server文件下(可以将solr.war解压出来会有个solr的文件夹)

3、将盘符:solr\home\collection1\conf文件下的solrconfig.xml中的索引库存储地址改成

<dataDir>${solr.data.dir:盘符:\solr\home\collection1\data}</dataDir>

4、配置solr服务器在tomcat的server.xml中

<Host name="localhost" appBase="webapps"

unpackWARs="true" autoDeploy="true">

配置slor服务器的地址(注意:如果你将solr.war解压出来了,下面的地址得配置成 盘符:\solr\server\solr)

<Context path="/solr" docBase="盘符:\solr\server\solr.war" reloadale="false"></Context>

<!-- SingleSignOn valve, share authentication between web applications

Documentation at: /docs/config/valve.html -->

<!--

<Valve className="org.apache.catalina.authenticator.SingleSignOn" />

-->

<!-- Access log processes all example.

Documentation at: /docs/config/valve.html

Note: The pattern used is equivalent to using pattern="common" -->

<Valve className="org.apache.catalina.valves.AccessLogValve" directory="logs"

prefix="localhost_access_log." suffix=".txt"

pattern="%h %l %u %t "%r" %s %b" />

</Host>

5、为tomcat设置相应的环境变量,设置solr主目录的地址

<Context path="/solr" docBase="盘符:\solr\server" reloadale="false">

<Environment name="solr/home" type="java.lang.String" value="盘符:\solr\home" override="true"></Environment>

</Context>

6、将解压的solr文件下的example下的lib下的etc下的所有jar包全部拷贝到tomcat的lib下(如果报Failed to initialize Apache Solr: Could not find necessary SLF4j logging jars. If using Jetty....是因为关于slf4j的所有jar包没有拷贝到tomcat下的lib中)

7、可以通过tomcat去访问solr http://localhost:8080/solr/
=============IK Analyzer 2012FF_hf1中文分词配置=============

1、将IKAnalyzer2012FF_u1.jar导入 盘符:\solr\server\solr\WEB-INF\lib中

(并且要有commons-io-2.3.jar,commons-logging-1.1.1.jar两个jar)

2、将IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf(盘符:\solr\server\solr\WEB-INF\classes)下面(注意:如果没有classe文件夹自己创建一个classes文件夹,方便配置自己的定义的词库)

3、在 盘符:\solr\home\collection1\conf\schema.xml中配置以下配置

<fieldType name="text_ik" class="solr.TextField">

<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

=============IK Analyzer 2012FF_hf1配置自定义词库=============

1、修改 盘符:\solr\server\solr\WEB-INF\classes文件夹的IKAnalyzer.cfg.xml配置文件如下 将自己定义的词库文件放入 盘符:\solr\server\solr\WEB-INF\classes下和IKAnalyzer.cfg.xml在一个目录中

(注意:ext.dic的编码必须是Encode in UTF-8 without BOM,否则自定义的词库不会被识别如果想配置多个自定义词库,可以<entry key="ext_dict">ext.dic;mydic.dic</entry>用分号(;)隔开 )

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

<properties>

<comment>IK Analyzer 扩展配置</comment>

<!--用户可以在这里配置自己的扩展字典 -->

<entry key="ext_dict">ext.dic;</entry>

<!--用户可以在这里配置自己的扩展停止词字典-->

<entry key="ext_stopwords">stopword.dic;</entry>

</properties>
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: