solr-4.6配置中文分词器ik-analyzer
2016-01-27 12:05
316 查看
solr本身对中文分词的处理不是太好,所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理,ik-analyzer就是其中一个不错的中文分词器。
一、版本信息
solr版本:4.6
需要ik-analyzer版本:IK Analyzer 2012FF_hf1
二、配置步骤
下载压缩解压
我们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\WEB-INF\lib下面。
我们把IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf下面,和core的schema.xml文件一个目录。
修改core的schema.xml:
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
复制代码
配置测试字段:
<field name="quesContent" type="text_ik" />
复制代码
三:测试配置
一、版本信息
solr版本:4.6
需要ik-analyzer版本:IK Analyzer 2012FF_hf1
二、配置步骤
下载压缩解压
我们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\WEB-INF\lib下面。
我们把IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf下面,和core的schema.xml文件一个目录。
修改core的schema.xml:
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
复制代码
配置测试字段:
<field name="quesContent" type="text_ik" />
复制代码
三:测试配置
相关文章推荐
- nefu 116 两仪剑法
- Python 7.2 StringIO和BytesIO
- Tomcat报错—Invalid keystore format ,tomcat启动报错
- 怎样将Url中的中文转为为UTF-8
- PHPStorm配置及常用快捷键
- Windows Server 2012 克隆修改SID
- mybatis有符合条件的结果但是查询不出
- ios开发网络协议基础 初探
- 用awk 取出ifconfig eth0中IP的方法
- Android签名机制之---签名过程详解
- POJ 2635(同余定理)
- 随笔 | Python的Flask强制使http跳转到https页面
- Process's address space and heap
- nefu 115 斐波那契的整除
- cvpr2015文章整理
- 多应用共享cookie引发的问题
- C#版机房重构登录(不完整版)
- 网站扩展实例:1亿用户、50亿pv的Tagged架构进化史
- 用grunt搭建自动化的web前端开发环境-完整教程
- Linux中与DNS相关的内容