[solr] - IKAnalyzer 扩展分词库
2016-01-19 14:39
417 查看
在solr中加入自己的扩展分词库方法:
参考文章:
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html
1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes
2、新增一个文件:IKAnalyzer.cfg.xml
说明:
my.dic即为扩展分词库,分词库可以为多个,以分号隔开即可。停止词库一样。
3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:
4、保存,重启solr。
使用了新的分词,需要重新建索引数据。
5、测试:
参考文章:
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html
1、在solr的web中:\WEB-INF目录下新增一个文件夹:classes
2、新增一个文件:IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展字典--> <entry key="ext_dict">my.dic;</entry> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">stopword.dic;</entry> </properties>
说明:
my.dic即为扩展分词库,分词库可以为多个,以分号隔开即可。停止词库一样。
3、新增my.dic文件。文件格式必需是:无BOM的UTF-8格式,示例内容为:
西丽
4、保存,重启solr。
使用了新的分词,需要重新建索引数据。
5、测试:
![](http://images.cnitblog.com/blog/6088/201410/141117322322741.png)
相关文章推荐
- java对世界各个时区(TimeZone)的通用转换处理方法(转载)
- java-注解annotation
- java-模拟tomcat服务器
- java-用HttpURLConnection发送Http请求.
- java-WEB中的监听器Lisener
- Android IPC进程间通讯机制
- Android Native 绘图方法
- Android java 与 javascript互访(相互调用)的方法例子
- 介绍一款信息管理系统的开源框架---jeecg
- 聚类算法之kmeans算法java版本
- java实现 PageRank算法
- PropertyChangeListener简单理解
- c++11 + SDL2 + ffmpeg +OpenAL + java = Android播放器
- 插入排序
- 冒泡排序
- 堆排序
- 快速排序
- 二叉查找树