java语言开发的轻量级的中文分词工具包
2015-09-08 09:25
399 查看
package com.haha.test; import java.io.IOException; import java.io.StringReader; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.TokenStream; import org.apache.lucene.analysis.tokenattributes.CharTermAttribute; import org.wltea.analyzer.lucene.IKAnalyzer; public class SplitWords { public static void main(String[] args) throws IOException { String text="基于java语言开发的轻量级的中文分词工具包"; //创建分词对象 Analyzer anal=new IKAnalyzer(true); StringReader reader=new StringReader(text); //分词 TokenStream ts=anal.tokenStream("", reader); CharTermAttribute term=ts.getAttribute(CharTermAttribute.class); //遍历分词数据 while(ts.incrementToken()){ System.out.print(term.toString()+"|"); } reader.close(); System.out.println(); } }
版权声明:本文为博主原创文章,未经博主允许不得转载。
相关文章推荐
- Java语言规范——每个Java开发人员都需要认真阅读的书籍,包含下载地址
- 解决了个JDK(Java Development Kit,Java开发工具包)配置的问题
- ubuntu 8.04下java语言开发的搭建
- 使用 JavaServer Pages 技术开发多语言 Web 应用程序
- 轻量级java snmp设备网管软件开发技术
- 基于JCreator的轻量级Java Web开发平台的搭建全攻略
- java jodd轻量级开发框架
- 解决方案:mysql的中文问题(开发语言:Java)
- Sun推出Java语言互联网应用软件工具包
- 轻量级java snmp设备网管软件开发技术
- Resin是CAUCHO公司的产品,是一个非常流行的application server,对servlet和JSP提供了良好的支持,性能也比较优良,resin自身采用JAVA语言开发。
- 针对Android开发中Java语言的重点难点分享
- 轻量级的中文分词工具包 - IK Analyzer
- Xianfeng轻量级Java中间件平台:一期开发计划
- 从 iOS,Objective-C, IPhone, iPad, Android, Java, Node.js 或其他平台,或通过其他开发语言,使用WS-Trust请求一个ADFS的令牌
- AJAX报告:开发平台及语言Java皆胜微软
- Java咖啡馆(5)——Java语言基础-Java基础-Java-编程开发
- 7月份的开发语言排行榜,加大了我对学JAVA信心。
- 开发语言王者的背影:看看Java的第14年
- 使用java语言开发excel