使用Lucene和IKAnalyzer实现 中文简单 分词
2012-08-03 15:04
726 查看
import java.io.IOException; import java.io.StringReader; import java.util.ArrayList; import org.wltea.analyzer.IKSegmentation; import org.wltea.analyzer.Lexeme; public class Test { public static ArrayList<String> getStringSet(String s)throws IOException{ ArrayList<String> ali = new ArrayList<String>(); StringReader reader = new StringReader(s); IKSegmentation ik = new IKSegmentation(reader , true); Lexeme lexeme = null; while ((lexeme = ik.next()) != null) { ali.add(lexeme.getLexemeText()); } return ali; } public static void main(String[] args) throws IOException { String s = "头痛是一种病"; ArrayList<String> aList = Test.getStringSet(s); while(!aList.isEmpty()){ System.out.println(aList.get(0)); aList.remove(0); } } }
// 输出:
头痛
是
一种
病
——————————————————————————————————
实现输入的语句的分词。
相关文章推荐
- Lucene6.5.0 下中文分词IKAnalyzer编译和使用
- Beta笔记——搜索引擎的设计与实现(1):使用Lucene.Net建立索引与中文分词
- 使用LUCENE快速实现属于自己的英文分词程序——附简单实现
- Lucene6.5.0 下中文分词IKAnalyzer编译和使用
- 使用Lucene和IKAnalyzer做简单的字符串分词
- Lucene使用IKAnalyzer中文分词笔记 Jialy Jialy
- lucene第一步---5.中文分词IKAnalyzer和高亮highlighter的使用
- IKAnalyzer结合Lucene实现中文分词(示例讲解)
- Lucene使用IKAnalyzer中文分词笔记
- .NET使用Lucene.Net和盘古分词类库实现中文分词
- lucene---中文分词IKAnalyzer和高亮highlighter的使用
- 使用scws组件分词和phpanalysis分词类实现简单的php分词搜索
- 使用IKAnalyzer进行中文分词
- 中文分词之Java实现使用IK Analyzer实现
- Lucene中文分词实现方法:基于StopWord分割分词
- Lucene-IKAnalyzer(中文分词)基于配置的词典扩充
- 【Apache Solr系列】使用IKAnalyzer中文分词以及自定义分词字典
- 中文分词 mmseg4j 在 lucene 中的使用示例
- Java实现敏感词过滤 - IKAnalyzer中文分词工具
- Java实现敏感词过滤 - IKAnalyzer中文分词工具