solr1:solr5.1.0 tomcat 安装,集成 mmseg4j 中文分词
2015-05-05 16:22
609 查看
1. 安装环境
jdk1.8 tomcat7.0.61 solr-5.1.0
jdk tomcat的安装默认已安装
2.下载solr 并将其解压 , 下载地址:http://mirrors.cnnic.cn/apache/lucene/solr/
$tar -zxf solr-5.1.0.tgz
注:解压后的目录为 solr-5.1.0 tomcat目录为 tomcat。安装solr要的相关文件都在solr-5.1.0/server 中
3.安装solr
3.1 创建solr安装目录 solrBase
$mkdir solrBase
目录结构说明:
solrBase
solr ----------solr home
coreA----------solr core相关配置
tomcat-----------tomcat目录
注:该目录相当于一个solr的总目录 其中solr 是solr home(创建的每一个 core就在这个目录下面的一个目录,core的配置在solr-5.1.0/server/solr/configsets/ 目录下 包括了不同类型core 的配置) ,tomcat 是运行的容器
3.2 将 solr-5.1.0/server/solr 目录copy到 solrBase目录下
$cp -r solr-5.1.0/server/solr ./solrBase/
3.3 将tomcat copy到 solrBase目录下
cp -r tomcat/ ./solrBase/
3.4 修改tomcat的配置项
i.修改编码 URIEncoding="UTF-8" useBodyEncodingForURI="true"
注:修改自己想修改的配置
3.5 把solr的相关jar到solrBase/tomcat/lib 目录下
$cp solr-5.1.0/server/lib/ext/*.jar solrBase/tomcat/lib/
$cp solr-5.1.0/server/lib/*.jar solrBase/tomcat/lib/
3.6 将solr.war copy 到tomcat/webapps 目录下
$cp solr-5.1.0/server/webapps/solr.war solrBase/tomcat/webapps/
3.7 启动tomcat,访问http://192.168.13.131:8080/solr/,等启动完毕后,关闭tomcat配置solr
home
修改solrBase/tomcat/webapps/solr/WEB-INF/web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/app/solrBase/solr</env-entry-value> <!-- 指定solr home -->
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
3.8 在 tomcat/webaapps/solr/WEB-INF/ 下创建classes目录,把 solr-5.1.0/server/resource/log4j.propertis 复制到classes目录下
重启即可
3.9 访问后没有可用的core
3.9.1页面新增core
新建coreA
1)在 solrBase/solr/下创建目录coreA
$mkdir solrBase/solr/coreA
2)复制配置文件。配置文件在solr-5.1.0/server/solr/configsets/ 下面,有多个类型的core;复制basic_configs/conf 目录到刚才创建的coreA目录
$cp -r solr-5.1.0/server/solr/configsets/basic_configs/conf/ solrBase/solr/coreA
再在页面上创建就可以了,如同以前的版本一样
3.9.2通过配置修改 $solr_home/core/conf/core.properties 文件(相关配置按照3.9.1中的复制)
name=coreA
config=solrconfig.xml
schema=schema.xml
dataDir=data
solrconfig.xml schema.xml文件解析
http://www.blogjava.net/conans/articles/379545.html
集成 mmseg4j 中文分词
http://www.oschina.net/p/mmseg4j
https://github.com/chenlb/mmseg4j-solr
1. 下载 mmseg4j(我使用的是2.3.0)
https://github.com/chenlb/mmseg4j-solr
该页面有支持的版本说明
2. 解压下载的zip包,如图
把两个jar包复制到 solr/WEB-INF/lib 目录下
3.修改solr home 目录下的coreA的schema.xml文件,在文件后面追加:
在最后的一个fieldtype配置有一个指定dicPath的配置可能直接删除,已经集成到jar文件中。这里主要是说明可以自己指定 字典文件
重新启动tomcat即可
4.测试,如图(图有core和上面不一致,只是名字不同)
solr-solrj 和服务交互: http://download.csdn.net/detail/convict_eva/8664249
solr 单机安装
http://wiki.apache.org/solr/SolrTomcat
1. 安装环境
jdk1.8 tomcat7.0.61 solr-5.1.0
jdk tomcat的安装默认已安装
2.下载solr 并将其解压 , 下载地址:http://mirrors.cnnic.cn/apache/lucene/solr/
$tar -zxf solr-5.1.0.tgz
注:解压后的目录为 solr-5.1.0 tomcat目录为 tomcat。安装solr要的相关文件都在solr-5.1.0/server 中
3.安装solr
3.1 创建solr安装目录 solrBase
$mkdir solrBase
目录结构说明:
solrBase
solr ----------solr home
coreA----------solr core相关配置
tomcat-----------tomcat目录
注:该目录相当于一个solr的总目录 其中solr 是solr home(创建的每一个 core就在这个目录下面的一个目录,core的配置在solr-5.1.0/server/solr/configsets/ 目录下 包括了不同类型core 的配置) ,tomcat 是运行的容器
3.2 将 solr-5.1.0/server/solr 目录copy到 solrBase目录下
$cp -r solr-5.1.0/server/solr ./solrBase/
3.3 将tomcat copy到 solrBase目录下
cp -r tomcat/ ./solrBase/
3.4 修改tomcat的配置项
i.修改编码 URIEncoding="UTF-8" useBodyEncodingForURI="true"
注:修改自己想修改的配置
3.5 把solr的相关jar到solrBase/tomcat/lib 目录下
$cp solr-5.1.0/server/lib/ext/*.jar solrBase/tomcat/lib/
$cp solr-5.1.0/server/lib/*.jar solrBase/tomcat/lib/
3.6 将solr.war copy 到tomcat/webapps 目录下
$cp solr-5.1.0/server/webapps/solr.war solrBase/tomcat/webapps/
3.7 启动tomcat,访问http://192.168.13.131:8080/solr/,等启动完毕后,关闭tomcat配置solr
home
修改solrBase/tomcat/webapps/solr/WEB-INF/web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/app/solrBase/solr</env-entry-value> <!-- 指定solr home -->
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
3.8 在 tomcat/webaapps/solr/WEB-INF/ 下创建classes目录,把 solr-5.1.0/server/resource/log4j.propertis 复制到classes目录下
重启即可
3.9 访问后没有可用的core
3.9.1页面新增core
新建coreA
1)在 solrBase/solr/下创建目录coreA
$mkdir solrBase/solr/coreA
2)复制配置文件。配置文件在solr-5.1.0/server/solr/configsets/ 下面,有多个类型的core;复制basic_configs/conf 目录到刚才创建的coreA目录
$cp -r solr-5.1.0/server/solr/configsets/basic_configs/conf/ solrBase/solr/coreA
再在页面上创建就可以了,如同以前的版本一样
3.9.2通过配置修改 $solr_home/core/conf/core.properties 文件(相关配置按照3.9.1中的复制)
name=coreA
config=solrconfig.xml
schema=schema.xml
dataDir=data
solrconfig.xml schema.xml文件解析
http://www.blogjava.net/conans/articles/379545.html
集成 mmseg4j 中文分词
http://www.oschina.net/p/mmseg4j
https://github.com/chenlb/mmseg4j-solr
1. 下载 mmseg4j(我使用的是2.3.0)
https://github.com/chenlb/mmseg4j-solr
该页面有支持的版本说明
2. 解压下载的zip包,如图
把两个jar包复制到 solr/WEB-INF/lib 目录下
3.修改solr home 目录下的coreA的schema.xml文件,在文件后面追加:
在最后的一个fieldtype配置有一个指定dicPath的配置可能直接删除,已经集成到jar文件中。这里主要是说明可以自己指定 字典文件
重新启动tomcat即可
4.测试,如图(图有core和上面不一致,只是名字不同)
jdk1.8 tomcat7.0.61 solr-5.1.0
jdk tomcat的安装默认已安装
2.下载solr 并将其解压 , 下载地址:http://mirrors.cnnic.cn/apache/lucene/solr/
$tar -zxf solr-5.1.0.tgz
注:解压后的目录为 solr-5.1.0 tomcat目录为 tomcat。安装solr要的相关文件都在solr-5.1.0/server 中
3.安装solr
3.1 创建solr安装目录 solrBase
$mkdir solrBase
目录结构说明:
solrBase
solr ----------solr home
coreA----------solr core相关配置
tomcat-----------tomcat目录
注:该目录相当于一个solr的总目录 其中solr 是solr home(创建的每一个 core就在这个目录下面的一个目录,core的配置在solr-5.1.0/server/solr/configsets/ 目录下 包括了不同类型core 的配置) ,tomcat 是运行的容器
3.2 将 solr-5.1.0/server/solr 目录copy到 solrBase目录下
$cp -r solr-5.1.0/server/solr ./solrBase/
3.3 将tomcat copy到 solrBase目录下
cp -r tomcat/ ./solrBase/
3.4 修改tomcat的配置项
i.修改编码 URIEncoding="UTF-8" useBodyEncodingForURI="true"
注:修改自己想修改的配置
3.5 把solr的相关jar到solrBase/tomcat/lib 目录下
$cp solr-5.1.0/server/lib/ext/*.jar solrBase/tomcat/lib/
$cp solr-5.1.0/server/lib/*.jar solrBase/tomcat/lib/
3.6 将solr.war copy 到tomcat/webapps 目录下
$cp solr-5.1.0/server/webapps/solr.war solrBase/tomcat/webapps/
3.7 启动tomcat,访问http://192.168.13.131:8080/solr/,等启动完毕后,关闭tomcat配置solr
home
修改solrBase/tomcat/webapps/solr/WEB-INF/web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/app/solrBase/solr</env-entry-value> <!-- 指定solr home -->
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
3.8 在 tomcat/webaapps/solr/WEB-INF/ 下创建classes目录,把 solr-5.1.0/server/resource/log4j.propertis 复制到classes目录下
重启即可
3.9 访问后没有可用的core
3.9.1页面新增core
新建coreA
1)在 solrBase/solr/下创建目录coreA
$mkdir solrBase/solr/coreA
2)复制配置文件。配置文件在solr-5.1.0/server/solr/configsets/ 下面,有多个类型的core;复制basic_configs/conf 目录到刚才创建的coreA目录
$cp -r solr-5.1.0/server/solr/configsets/basic_configs/conf/ solrBase/solr/coreA
再在页面上创建就可以了,如同以前的版本一样
3.9.2通过配置修改 $solr_home/core/conf/core.properties 文件(相关配置按照3.9.1中的复制)
name=coreA
config=solrconfig.xml
schema=schema.xml
dataDir=data
solrconfig.xml schema.xml文件解析
http://www.blogjava.net/conans/articles/379545.html
集成 mmseg4j 中文分词
http://www.oschina.net/p/mmseg4j
https://github.com/chenlb/mmseg4j-solr
1. 下载 mmseg4j(我使用的是2.3.0)
https://github.com/chenlb/mmseg4j-solr
该页面有支持的版本说明
2. 解压下载的zip包,如图
把两个jar包复制到 solr/WEB-INF/lib 目录下
3.修改solr home 目录下的coreA的schema.xml文件,在文件后面追加:
<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/> </analyzer> </fieldtype> <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" /> </analyzer> </fieldtype> <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100"> <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" /> </analyzer> </fieldtype>
在最后的一个fieldtype配置有一个指定dicPath的配置可能直接删除,已经集成到jar文件中。这里主要是说明可以自己指定 字典文件
重新启动tomcat即可
4.测试,如图(图有core和上面不一致,只是名字不同)
solr-solrj 和服务交互: http://download.csdn.net/detail/convict_eva/8664249
solr 单机安装
http://wiki.apache.org/solr/SolrTomcat
1. 安装环境
jdk1.8 tomcat7.0.61 solr-5.1.0
jdk tomcat的安装默认已安装
2.下载solr 并将其解压 , 下载地址:http://mirrors.cnnic.cn/apache/lucene/solr/
$tar -zxf solr-5.1.0.tgz
注:解压后的目录为 solr-5.1.0 tomcat目录为 tomcat。安装solr要的相关文件都在solr-5.1.0/server 中
3.安装solr
3.1 创建solr安装目录 solrBase
$mkdir solrBase
目录结构说明:
solrBase
solr ----------solr home
coreA----------solr core相关配置
tomcat-----------tomcat目录
注:该目录相当于一个solr的总目录 其中solr 是solr home(创建的每一个 core就在这个目录下面的一个目录,core的配置在solr-5.1.0/server/solr/configsets/ 目录下 包括了不同类型core 的配置) ,tomcat 是运行的容器
3.2 将 solr-5.1.0/server/solr 目录copy到 solrBase目录下
$cp -r solr-5.1.0/server/solr ./solrBase/
3.3 将tomcat copy到 solrBase目录下
cp -r tomcat/ ./solrBase/
3.4 修改tomcat的配置项
i.修改编码 URIEncoding="UTF-8" useBodyEncodingForURI="true"
注:修改自己想修改的配置
3.5 把solr的相关jar到solrBase/tomcat/lib 目录下
$cp solr-5.1.0/server/lib/ext/*.jar solrBase/tomcat/lib/
$cp solr-5.1.0/server/lib/*.jar solrBase/tomcat/lib/
3.6 将solr.war copy 到tomcat/webapps 目录下
$cp solr-5.1.0/server/webapps/solr.war solrBase/tomcat/webapps/
3.7 启动tomcat,访问http://192.168.13.131:8080/solr/,等启动完毕后,关闭tomcat配置solr
home
修改solrBase/tomcat/webapps/solr/WEB-INF/web.xml
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/app/solrBase/solr</env-entry-value> <!-- 指定solr home -->
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
3.8 在 tomcat/webaapps/solr/WEB-INF/ 下创建classes目录,把 solr-5.1.0/server/resource/log4j.propertis 复制到classes目录下
重启即可
3.9 访问后没有可用的core
3.9.1页面新增core
新建coreA
1)在 solrBase/solr/下创建目录coreA
$mkdir solrBase/solr/coreA
2)复制配置文件。配置文件在solr-5.1.0/server/solr/configsets/ 下面,有多个类型的core;复制basic_configs/conf 目录到刚才创建的coreA目录
$cp -r solr-5.1.0/server/solr/configsets/basic_configs/conf/ solrBase/solr/coreA
再在页面上创建就可以了,如同以前的版本一样
3.9.2通过配置修改 $solr_home/core/conf/core.properties 文件(相关配置按照3.9.1中的复制)
name=coreA
config=solrconfig.xml
schema=schema.xml
dataDir=data
solrconfig.xml schema.xml文件解析
http://www.blogjava.net/conans/articles/379545.html
集成 mmseg4j 中文分词
http://www.oschina.net/p/mmseg4j
https://github.com/chenlb/mmseg4j-solr
1. 下载 mmseg4j(我使用的是2.3.0)
https://github.com/chenlb/mmseg4j-solr
该页面有支持的版本说明
2. 解压下载的zip包,如图
把两个jar包复制到 solr/WEB-INF/lib 目录下
3.修改solr home 目录下的coreA的schema.xml文件,在文件后面追加:
<fieldtypename="textComplex"class="solr.TextField"positionIncrementGap="100"> <analyzer> <tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="complex"dicPath="dic"/> </analyzer> </fieldtype> <fieldtypename="textMaxWord"class="solr.TextField"positionIncrementGap="100"> <analyzer> <tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="max-word" /> </analyzer> </fieldtype> <fieldtypename="textSimple"class="solr.TextField"positionIncrementGap="100"> <analyzer> <tokenizerclass="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory"mode="simple"dicPath="n:/custom/path/to/my_dic" /> </analyzer> </fieldtype>
在最后的一个fieldtype配置有一个指定dicPath的配置可能直接删除,已经集成到jar文件中。这里主要是说明可以自己指定 字典文件
重新启动tomcat即可
4.测试,如图(图有core和上面不一致,只是名字不同)
相关文章推荐
- Lucence的solr的安装和Tomcat的整合(带中文分词)
- solr 7.0 tomcat 安装配置 + 中文分词
- solr5.5.3 集成mmseg4j 中文分词(二)
- solr中集成中文分词 mmseg4j
- solr 7+tomcat 8 + mysql实现solr 7基本使用(安装、集成中文分词器、定时同步数据库数据以及项目集成)
- Solr 5.x集成中文分词word,mmseg4j
- solr 中文分词 mmseg4j 使用例子 ,NGramTokenizerFactory
- solr下配置中文分词mmseg4j
- 全文检索引擎Solr系列——整合中文分词组件mmseg4j
- solr4.5部署到tomcat以及solr4.5配置中文分词器mmseg4j
- Solr4.0+IKAnalyzer中文分词安装
- solr5.3.1 添加中文分词之mmseg4j
- Solr4:加入中文分词mmseg4j
- 《solr笔记》Linux下tomcat7+solr-4.7.0+Ik中文分词器安装
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- solr 5.5.1安装并配置中文分词IKAnalyzer
- Solr4:配置mmseg4j同义词(已经配置好中文分词)
- 全文检索引擎Solr系列——整合中文分词组件mmseg4j