您的位置:首页 > 其它

elasticsearch ik分词实现 中文、拼音、同义词搜索

2016-11-24 14:36 405 查看
EasticSearch版本:1.5.2

1、配置分词器:配置IK,参照 《ElasticSearch 安装和使用IK分词器

2、拼音分词器配置:使用已经编译好的:elasticsearch-analysis-pinyin-1.3.0

  2.1、在elasticsearch的plugins目录下,新建analysis-pinyin文件夹,解压上述压缩包,将里面的

  


放到analysis-pinyin文件夹。

  2.2同时在elasticsearch.yml里面配置好拼音分词器的过滤器:



3、同义词分词器配置:

  3.1、在elasticsearch.yml里面配置好同义词分词器的过滤器:



  3.2、配置同义词词库,在elasticsearch的config目录下新建sysnonym.txt。
4、配置ik+pinying+同义词的分词器:
index:
analysis:
analyzer:
ik:
alias: [news_analyzer_ik,ik_analyzer]
type: org.elasticsearch.index.analysis.IkAnalyzerProvider
ik_analyzer_pinyin:
type: custom
tokenizer: ik
filter: [synonym_test_filter,pinyin_mcl]
filter:
synonym_test_filter:
type: synonym_filter
synonyms_path: synonym.txt
dynamic_reload: true
reload_interval: 10s
expand: true
pinyin_mcl:
type: pinyin
first_letter: none
padding_char: ""

分词器配置说明:
ik_analyzer_pinyin: //分词器的名称
type: custom //类型:custom 表示自己定制
tokenizer: ik //分割词元的组件:这里使用的是IK
filter: [synonym_test_filter,pinyin_mcl] //对分割的次元做处理:这里使用的是拼音和同义词
5、分词器使用:参考 《ElasticSearch
安装和使用IK分词器》
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: