Solr5.5 中文分词及同义词
2016-05-16 11:35
302 查看
Solr对中文的默认分词效果不好,例如下图:
这里采用IK-Analyzer进行中文分词,IK-Analyzer对solr5以上的版本支持在:
https://github.com/EugenePig/ik-analyzer-solr5
将编译好的ik-analyzer-solr5-5.x.jar拷贝至solr-5.5.0/server/solr-webapp/webapp/WEB-INF/lib
编辑solr-5.5.0/server/solr/core1/conf/schema.xml,添加以下内容:
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" />
<!-- 如果不做同义词,可以不配置下面这个Filter -->
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
</analyzer>
</fieldType>
同义词的配置在
solr-5.5.0/server/solr/core1/conf/synonyms.txt,一组同义词占一行,例如,里面配置上
中国,China
重启solr, 在Analysis页面选择FieldType: text_ik,结果如下:
同义词查询结果如下:
这里采用IK-Analyzer进行中文分词,IK-Analyzer对solr5以上的版本支持在:
https://github.com/EugenePig/ik-analyzer-solr5
将编译好的ik-analyzer-solr5-5.x.jar拷贝至solr-5.5.0/server/solr-webapp/webapp/WEB-INF/lib
编辑solr-5.5.0/server/solr/core1/conf/schema.xml,添加以下内容:
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" />
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" />
<!-- 如果不做同义词,可以不配置下面这个Filter -->
<filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
</analyzer>
</fieldType>
同义词的配置在
solr-5.5.0/server/solr/core1/conf/synonyms.txt,一组同义词占一行,例如,里面配置上
中国,China
重启solr, 在Analysis页面选择FieldType: text_ik,结果如下:
同义词查询结果如下:
相关文章推荐
- ConcurrentHashMap 高并发性的实现机制
- linux安装redis及redis扩展
- Android EventBus源码解析 带你深入理解EventBus
- 九度题目1001:A+B for Matrices
- 《Windows API》创建文件写入系统目录路径
- iOS9新系统下App Store应用上传新指南
- GCD串行并发同步异步基本概念
- C++的回调机制
- Nginx下只针对logging.php进行https处理的重写规则 【转】
- bootstrapValidator 全局验证
- 语句练习题11
- 寻找中位数v1.0
- android view转化为image来实现某些功能
- AngularJS -- Directive参数
- 如何把String类型转化成Integer类型
- Android 自定义View并添加属性
- js/jq实现获取手机验证码倒计时效果
- 一步完成 MySQL 向 Redis 迁移
- 李白的诗: 南陵别儿童入京
- android studio2.1创建项目的两个坑