您的位置:首页 > 运维架构 > Tomcat

solr1:solr5.1.0 tomcat 安装,集成 mmseg4j 中文分词

2015-05-05 16:22 609 查看
1. 安装环境
jdk1.8 tomcat7.0.61 solr-5.1.0
jdk tomcat的安装默认已安装

2.下载solr 并将其解压 , 下载地址:http://mirrors.cnnic.cn/apache/lucene/solr/
$tar -zxf solr-5.1.0.tgz
注:解压后的目录为 solr-5.1.0 tomcat目录为 tomcat。安装solr要的相关文件都在solr-5.1.0/server 中

3.安装solr

3.1 创建solr安装目录 solrBase
$mkdir solrBase
目录结构说明:
solrBase
solr ----------solr home
coreA----------solr core相关配置
tomcat-----------tomcat目录
注:该目录相当于一个solr的总目录 其中solr 是solr home(创建的每一个 core就在这个目录下面的一个目录,core的配置在solr-5.1.0/server/solr/configsets/ 目录下 包括了不同类型core 的配置) ,tomcat 是运行的容器

3.2 将 solr-5.1.0/server/solr 目录copy到 solrBase目录下
$cp -r solr-5.1.0/server/solr ./solrBase/

3.3 将tomcat copy到 solrBase目录下
cp -r tomcat/ ./solrBase/

3.4 修改tomcat的配置项
i.修改编码 URIEncoding="UTF-8" useBodyEncodingForURI="true"
注:修改自己想修改的配置

3.5 把solr的相关jar到solrBase/tomcat/lib 目录下
$cp solr-5.1.0/server/lib/ext/*.jar solrBase/tomcat/lib/
$cp solr-5.1.0/server/lib/*.jar solrBase/tomcat/lib/

3.6 将solr.war copy 到tomcat/webapps 目录下
$cp solr-5.1.0/server/webapps/solr.war solrBase/tomcat/webapps/

3.7 启动tomcat,访问http://192.168.13.131:8080/solr/,等启动完毕后,关闭tomcat配置solr
home

修改solrBase/tomcat/webapps/solr/WEB-INF/web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/app/solrBase/solr</env-entry-value> <!-- 指定solr home -->
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
3.8 在 tomcat/webaapps/solr/WEB-INF/ 下创建classes目录,把 solr-5.1.0/server/resource/log4j.propertis 复制到classes目录下
重启即可

3.9 访问后没有可用的core
3.9.1页面新增core





新建coreA
1)在 solrBase/solr/下创建目录coreA
$mkdir solrBase/solr/coreA
2)复制配置文件。配置文件在solr-5.1.0/server/solr/configsets/ 下面,有多个类型的core;复制basic_configs/conf 目录到刚才创建的coreA目录
$cp -r solr-5.1.0/server/solr/configsets/basic_configs/conf/ solrBase/solr/coreA
再在页面上创建就可以了,如同以前的版本一样

3.9.2通过配置修改 $solr_home/core/conf/core.properties 文件(相关配置按照3.9.1中的复制)
name=coreA
config=solrconfig.xml
schema=schema.xml
dataDir=data

solrconfig.xml schema.xml文件解析
http://www.blogjava.net/conans/articles/379545.html

集成 mmseg4j 中文分词
http://www.oschina.net/p/mmseg4j
https://github.com/chenlb/mmseg4j-solr

1. 下载 mmseg4j(我使用的是2.3.0)
https://github.com/chenlb/mmseg4j-solr
该页面有支持的版本说明

2. 解压下载的zip包,如图



把两个jar包复制到 solr/WEB-INF/lib 目录下

3.修改solr home 目录下的coreA的schema.xml文件,在文件后面追加:

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
</analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" />
</analyzer>
</fieldtype>


在最后的一个fieldtype配置有一个指定dicPath的配置可能直接删除,已经集成到jar文件中。这里主要是说明可以自己指定 字典文件
重新启动tomcat即可

4.测试,如图(图有core和上面不一致,只是名字不同)





solr-solrj 和服务交互: http://download.csdn.net/detail/convict_eva/8664249
solr 单机安装
http://wiki.apache.org/solr/SolrTomcat

1. 安装环境
jdk1.8 tomcat7.0.61 solr-5.1.0
jdk tomcat的安装默认已安装

2.下载solr 并将其解压 , 下载地址:http://mirrors.cnnic.cn/apache/lucene/solr/
$tar -zxf solr-5.1.0.tgz
注:解压后的目录为 solr-5.1.0 tomcat目录为 tomcat。安装solr要的相关文件都在solr-5.1.0/server 中

3.安装solr

3.1 创建solr安装目录 solrBase
$mkdir solrBase
目录结构说明:
solrBase
solr ----------solr home
coreA----------solr core相关配置
tomcat-----------tomcat目录
注:该目录相当于一个solr的总目录 其中solr 是solr home(创建的每一个 core就在这个目录下面的一个目录,core的配置在solr-5.1.0/server/solr/configsets/ 目录下 包括了不同类型core 的配置) ,tomcat 是运行的容器

3.2 将 solr-5.1.0/server/solr 目录copy到 solrBase目录下
$cp -r solr-5.1.0/server/solr ./solrBase/

3.3 将tomcat copy到 solrBase目录下
cp -r tomcat/ ./solrBase/

3.4 修改tomcat的配置项
i.修改编码 URIEncoding="UTF-8" useBodyEncodingForURI="true"
注:修改自己想修改的配置

3.5 把solr的相关jar到solrBase/tomcat/lib 目录下
$cp solr-5.1.0/server/lib/ext/*.jar solrBase/tomcat/lib/
$cp solr-5.1.0/server/lib/*.jar solrBase/tomcat/lib/

3.6 将solr.war copy 到tomcat/webapps 目录下
$cp solr-5.1.0/server/webapps/solr.war solrBase/tomcat/webapps/

3.7 启动tomcat,访问http://192.168.13.131:8080/solr/,等启动完毕后,关闭tomcat配置solr
home

修改solrBase/tomcat/webapps/solr/WEB-INF/web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/app/solrBase/solr</env-entry-value> <!-- 指定solr home -->
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
3.8 在 tomcat/webaapps/solr/WEB-INF/ 下创建classes目录,把 solr-5.1.0/server/resource/log4j.propertis 复制到classes目录下
重启即可

3.9 访问后没有可用的core
3.9.1页面新增core



新建coreA
1)在 solrBase/solr/下创建目录coreA
$mkdir solrBase/solr/coreA
2)复制配置文件。配置文件在solr-5.1.0/server/solr/configsets/ 下面,有多个类型的core;复制basic_configs/conf 目录到刚才创建的coreA目录
$cp -r solr-5.1.0/server/solr/configsets/basic_configs/conf/ solrBase/solr/coreA
再在页面上创建就可以了,如同以前的版本一样

3.9.2通过配置修改 $solr_home/core/conf/core.properties 文件(相关配置按照3.9.1中的复制)
name=coreA
config=solrconfig.xml
schema=schema.xml
dataDir=data

solrconfig.xml schema.xml文件解析
http://www.blogjava.net/conans/articles/379545.html

集成 mmseg4j 中文分词
http://www.oschina.net/p/mmseg4j
https://github.com/chenlb/mmseg4j-solr

1. 下载 mmseg4j(我使用的是2.3.0)
https://github.com/chenlb/mmseg4j-solr
该页面有支持的版本说明

2. 解压下载的zip包,如图



把两个jar包复制到 solr/WEB-INF/lib 目录下

3.修改solr home 目录下的coreA的schema.xml文件,在文件后面追加:

<fieldtypename="textComplex"class="solr.TextField"positionIncrementGap="100">
<analyzer>
<tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="complex"dicPath="dic"/>
</analyzer>
</fieldtype>
<fieldtypename="textMaxWord"class="solr.TextField"positionIncrementGap="100">
<analyzer>
<tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="max-word" />
</analyzer>
</fieldtype>
<fieldtypename="textSimple"class="solr.TextField"positionIncrementGap="100">
<analyzer>
<tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="simple"dicPath="n:/custom/path/to/my_dic" />
</analyzer>
</fieldtype>


在最后的一个fieldtype配置有一个指定dicPath的配置可能直接删除,已经集成到jar文件中。这里主要是说明可以自己指定 字典文件
重新启动tomcat即可

4.测试,如图(图有core和上面不一致,只是名字不同)



内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: