lucene使用IKAnalyzer3.2.5中文分词器进行索引的一个小例子
2012-01-29 14:17
706 查看
本文通过一个小例子方便大家学习IKAnalyzer3.2.5和lucene的索引功能。以下是需要的准备环境 需要两个jar包。
分别是lucene 3.5.0.jar和IKAnalyzer3.2.5两个包
代码如下:
同时还要给大家分享一个在编程过程中出现的问题。截图如下:
Exception in thread "main" org.apache.lucene.index.IndexNotFoundException: no segments* file found in org.apache.lucene.store.RAMDirectory@1938039 lockFactory=org.apache.lucene.store.SingleInstanceLockFactory@c743eb:
files: [_0.fdx, _0.fdt]
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:712)
at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:75)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:462)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:308)
at test.main(test.java:51)
出现这种no segments* file found 的问题的时候,一种解决方法就是缺少了如下的一行代码。
分别是lucene 3.5.0.jar和IKAnalyzer3.2.5两个包
代码如下:
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; //import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.index.CorruptIndexException; import org.apache.lucene.index.IndexWriter; import org.apache.lucene.index.IndexWriterConfig; import org.apache.lucene.index.IndexReader; import org.apache.lucene.search.Query; import org.apache.lucene.search.TopDocs; import org.apache.lucene.search.IndexSearcher; import org.apache.lucene.store.Directory; import org.apache.lucene.store.FSDirectory; import org.apache.lucene.store.LockObtainFailedException; import org.apache.lucene.store.RAMDirectory; import org.apache.lucene.util.Version; import org.wltea.analyzer.lucene.IKAnalyzer; import org.wltea.analyzer.lucene.IKQueryParser; import org.wltea.analyzer.lucene.IKSimilarity; public class test { //private static final Directory IndexReader = null; public static void main(String args[]) throws Exception { RAMDirectory directory = new RAMDirectory(); //File INDEX_DIR = new File("E:\\temp\\index"); Analyzer analyzer = new IKAnalyzer(); IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_35, analyzer); IndexWriter indexWriter = new IndexWriter(directory, iwc); String str = "你好俊杰,这是成功的开始!加油!"; Document doc = new Document(); doc.add(new Field("contents",str,Field.Store.YES,Field.Index.ANALYZED)); indexWriter.addDocument(doc); str = "希望能够实现这一个项目,俊杰你可以的!"; doc = new Document(); doc.add(new Field("contents",str,Field.Store.YES,Field.Index.ANALYZED)); indexWriter.addDocument(doc); indexWriter.close(); //IndexReader reader = new IndexReader(); IndexReader reader = IndexReader.open(directory); IndexSearcher searcher = new IndexSearcher(reader); searcher.setSimilarity(new IKSimilarity()); String keyWords = "俊杰"; Query query = IKQueryParser.parse("contents", keyWords); TopDocs topDocs = searcher.search(query, Integer.MAX_VALUE); System.out.println(topDocs.totalHits); } }
同时还要给大家分享一个在编程过程中出现的问题。截图如下:
Exception in thread "main" org.apache.lucene.index.IndexNotFoundException: no segments* file found in org.apache.lucene.store.RAMDirectory@1938039 lockFactory=org.apache.lucene.store.SingleInstanceLockFactory@c743eb:
files: [_0.fdx, _0.fdt]
at org.apache.lucene.index.SegmentInfos$FindSegmentsFile.run(SegmentInfos.java:712)
at org.apache.lucene.index.DirectoryReader.open(DirectoryReader.java:75)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:462)
at org.apache.lucene.index.IndexReader.open(IndexReader.java:308)
at test.main(test.java:51)
出现这种no segments* file found 的问题的时候,一种解决方法就是缺少了如下的一行代码。
indexWriter.close();
相关文章推荐
- lucene使用IKAnalyzer3.2.8中文分词器进行索引的一个小例子
- JAVA_WEB项目之Lucene使用中文分词器IKAnalyzer3.2.8
- lucene集成ikanalyzer中文分词器插件;Analyzer使用时机
- Lucene2.0中使用基于词典的中文分词器建立索引
- 一个使用 ANSI.SYS Escape Sequences 进行时间显示的例子
- SQL优化基础 使用索引(一个小例子)
- lucene IKAnalyzer中文分词器学习(1)
- 一个使用 ANSI.SYS Escape Sequences 进行时间显示的例子
- lucene应用心得以及几种中文分词器的使用比对
- 使用Lucene对建立的索引进行搜索
- 一个WCF使用TCP协议进行通协的例子
- lucene---中文分词IKAnalyzer和高亮highlighter的使用
- 使用lucene 3.0.0 索引和检索中文文件
- Solr的学习使用之(三)IKAnalyzer中文分词器的配置
- Lucene建立索引 使用IKAnalyzer扩展词库
- 11大Java开源中文分词器的使用方法和分词效果对比,当前几个主要的Lucene中文分词器的比较
- lucene第一步---5.中文分词IKAnalyzer和高亮highlighter的使用
- SQL优化基础:使用索引(一个小例子)
- Android使用Unicode码对中文进行字母索引的2种方法
- Lucene使用IKAnalyzer中文分词笔记