paip.中文 分词 -- 同义词大全整理
2013-11-25 10:13
225 查看
paip.中文 分词 -- 同义词大全整理
同义词的处理方法:
作者Attilax 艾龙, EMAIL:1466519819@qq.com
来源:attilax的专栏
地址:http://blog.csdn.net/attilax
去重复
去反意词
合并多词条 a,b>>> a,b,c,d,...
tonitsi1_deduli_deFei.txt
14797条词条
tonitsi1_deduli_deFei_join.txt
大概6734条词条
参考:
│ 0两万同义词大全.txt
│ 1伪原创同义词库(13000条).txt
│ 2四十万汉语大词库.txt.txt
│ 3伪原创同义词库 2.txt
│ 4伪原创同义词库80K 2.txt
│ 5近义词大全 2.txt
│ 6同义词近义词大全.tx
│ 近反义词.doc
同义词的处理方法:
作者Attilax 艾龙, EMAIL:1466519819@qq.com
来源:attilax的专栏
地址:http://blog.csdn.net/attilax
去重复
去反意词
合并多词条 a,b>>> a,b,c,d,...
tonitsi1_deduli_deFei.txt
14797条词条
tonitsi1_deduli_deFei_join.txt
大概6734条词条
参考:
│ 0两万同义词大全.txt
│ 1伪原创同义词库(13000条).txt
│ 2四十万汉语大词库.txt.txt
│ 3伪原创同义词库 2.txt
│ 4伪原创同义词库80K 2.txt
│ 5近义词大全 2.txt
│ 6同义词近义词大全.tx
│ 近反义词.doc
相关文章推荐
- paip.中文 分词 -- 同义词大全整理
- 中文检索(分词、同义词、权重)
- 04_java Lucene学习——分词Analyzer(02):lucene4.0_学写简单的中文同义词分词器
- 中文分词整理
- 常用中文分词- 整理收集
- Elasticsearch1.x 基于lc-pinyin和ik分词实现 中文、拼音、同义词搜索
- Lucene整理--中文分词
- Lucene5中编写自定义同义词分词器(基于IK中文分词器)
- 自然语言处理_分词_停用词整理[哈工大、四川大学机器智能实验室停用词库、百度停用词库、中文停用词词表]
- ASP开发中可能遇到的错误信息中文说明大全(整理收集)
- Ubuntu16.x服务器 安装 Java,Elasticsearch5.4.X,中文分词,同义词,Logstash5.4.X 日志搜集
- 自己收集整理的微软错误代码大全(中文和英文)
- Solr5.5 中文分词及同义词
- 自己收集整理的微软错误代码大全(中文和英文)
- 机器学习笔记二十四 中文分词资料整理
- ASP开发中可能遇到的错误信息中文说明大全(整理收集)第1/2页
- ASP开发中可能遇到的错误信息中文说明大全(整理收集)
- solr6.6配置IK中文分词、IK扩展词、同义词、pinyin4j拼音分词
- 收集整理的中文分词算法相关论文、文献、期刊近100篇
- ASP开发中可能遇到的错误信息中文说明大全(整理收集)第1/2页