01-lucene简介和索引创建以及搜索
2015-04-03 17:34
483 查看
1.lucene是为了解决like中查询效率,准确性等问题而出现的。
2.lucene中创建索引的步骤
①.创建Directory(索引目录)
②.创建IndexWriter
③.创建Document对象
④.为Document添加Field
⑤.通过IndexWriter添加文档到索引中
⑥.关闭IndexWriter
3.lucene中搜索的步骤
①创建Directory
②创建IndexReader
③根据IndexReader创建IndexSearcher
④创建搜索的Query
⑤根据searcher搜索并返回TopDocs
⑥根据TopDocs获取ScoreDoc对象
⑦根据seacher和ScoreDoc对象获取具体的Document对象
⑧根据Document对象获取需要的值
⑨关闭IndexReader
具体的实现代码:
package org.itat.test;
import java.io.File;
import java.io.FileReader;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
public class HelloLucene {
/** 建立索引 */
public void index() {
IndexWriter writer = null;
try {
// 1.创建Directory(索引目录)
/** 内存索引 */
// Directory directory = new RAMDirectory();//索引是建立在内存中的
Directory directory = FSDirectory
.open(new File("d:/lucene/index01"));// 创建在硬盘上
// 2.创建IndexWriter(写索引)
IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_35,
new StandardAnalyzer(Version.LUCENE_35));
writer = new IndexWriter(directory, iwc);
// 3.创建Document对象
Document doc = new Document();
// 4.为Document添加Field(为Document的子元素)
File f = new File("d:/lucene/example");
for (File file : f.listFiles()) {
doc = new Document();
doc.add(new Field("content", new FileReader(file)));
doc.add(new Field("filename", file.getName(), Field.Store.YES,
Field.Index.NOT_ANALYZED));
doc.add(new Field("path", file.getAbsolutePath(),
Field.Store.YES, Field.Index.NOT_ANALYZED));
}
// 5.通过IndexWriter添加文档到索引中
writer.addDocument(doc);
} catch (Exception e) {
e.printStackTrace();
} finally {
if (writer != null) {
try {
writer.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
/** 搜索 */
public void searcher() {
try {
// 1.创建Directory
Directory directory = FSDirectory
.open(new File("d:/lucene/index01"));// 创建在硬盘上
// 2.创建IndexReader
IndexReader reader = IndexReader.open(directory);
// 3.根据IndexReader创建IndexSearcher
IndexSearcher searcher = new IndexSearcher(reader);
// 4.创建搜索的Query
// 创建parser来确定要搜索文件的内容,第二个参数表示搜索的域
QueryParser parser = new QueryParser(Version.LUCENE_35, "content",
new StandardAnalyzer(Version.LUCENE_35));
// 创建Query,表示搜索域为content中包含java的文档
Query query = parser.parse("浏览器");
// 5.根据seacher搜索并且返回TopDocs
TopDocs tds = searcher.search(query, 10);// 后面参数表示搜索的条数
// 6.根据TopDocs获取ScoreDoc对象
ScoreDoc[] sds = tds.scoreDocs;
for (ScoreDoc sd : sds) {
// 7.根据seacher和ScordDoc对象获取具体的Document对象
Document d = searcher.doc(sd.doc);
// 8.根据Document对象获取需要的值
System.out.println(d.get("filename") + "[" + d.get("path")
+ "]");
}
// 9.关闭Reader
reader.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
需要导入的Jar包
junit-4.7.jar
lucene-core-3.5.0.jar
可以在src中创建一个lib目录,然后将这俩个jar包复制进去,然后在build path, 然后add to build path
2.lucene中创建索引的步骤
①.创建Directory(索引目录)
②.创建IndexWriter
③.创建Document对象
④.为Document添加Field
⑤.通过IndexWriter添加文档到索引中
⑥.关闭IndexWriter
3.lucene中搜索的步骤
①创建Directory
②创建IndexReader
③根据IndexReader创建IndexSearcher
④创建搜索的Query
⑤根据searcher搜索并返回TopDocs
⑥根据TopDocs获取ScoreDoc对象
⑦根据seacher和ScoreDoc对象获取具体的Document对象
⑧根据Document对象获取需要的值
⑨关闭IndexReader
具体的实现代码:
package org.itat.test;
import java.io.File;
import java.io.FileReader;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopDocs;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;
public class HelloLucene {
/** 建立索引 */
public void index() {
IndexWriter writer = null;
try {
// 1.创建Directory(索引目录)
/** 内存索引 */
// Directory directory = new RAMDirectory();//索引是建立在内存中的
Directory directory = FSDirectory
.open(new File("d:/lucene/index01"));// 创建在硬盘上
// 2.创建IndexWriter(写索引)
IndexWriterConfig iwc = new IndexWriterConfig(Version.LUCENE_35,
new StandardAnalyzer(Version.LUCENE_35));
writer = new IndexWriter(directory, iwc);
// 3.创建Document对象
Document doc = new Document();
// 4.为Document添加Field(为Document的子元素)
File f = new File("d:/lucene/example");
for (File file : f.listFiles()) {
doc = new Document();
doc.add(new Field("content", new FileReader(file)));
doc.add(new Field("filename", file.getName(), Field.Store.YES,
Field.Index.NOT_ANALYZED));
doc.add(new Field("path", file.getAbsolutePath(),
Field.Store.YES, Field.Index.NOT_ANALYZED));
}
// 5.通过IndexWriter添加文档到索引中
writer.addDocument(doc);
} catch (Exception e) {
e.printStackTrace();
} finally {
if (writer != null) {
try {
writer.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
}
/** 搜索 */
public void searcher() {
try {
// 1.创建Directory
Directory directory = FSDirectory
.open(new File("d:/lucene/index01"));// 创建在硬盘上
// 2.创建IndexReader
IndexReader reader = IndexReader.open(directory);
// 3.根据IndexReader创建IndexSearcher
IndexSearcher searcher = new IndexSearcher(reader);
// 4.创建搜索的Query
// 创建parser来确定要搜索文件的内容,第二个参数表示搜索的域
QueryParser parser = new QueryParser(Version.LUCENE_35, "content",
new StandardAnalyzer(Version.LUCENE_35));
// 创建Query,表示搜索域为content中包含java的文档
Query query = parser.parse("浏览器");
// 5.根据seacher搜索并且返回TopDocs
TopDocs tds = searcher.search(query, 10);// 后面参数表示搜索的条数
// 6.根据TopDocs获取ScoreDoc对象
ScoreDoc[] sds = tds.scoreDocs;
for (ScoreDoc sd : sds) {
// 7.根据seacher和ScordDoc对象获取具体的Document对象
Document d = searcher.doc(sd.doc);
// 8.根据Document对象获取需要的值
System.out.println(d.get("filename") + "[" + d.get("path")
+ "]");
}
// 9.关闭Reader
reader.close();
} catch (Exception e) {
e.printStackTrace();
}
}
}
package org.itat.test; import org.junit.Test; public class TestLucene { //测试索引的创建 @Test public void testIndex(){ HelloLucene hl=new HelloLucene(); hl.index(); } //测试搜索 @Test public void testSearch(){ HelloLucene hl=new HelloLucene(); hl.searcher(); } }
需要导入的Jar包
junit-4.7.jar
lucene-core-3.5.0.jar
可以在src中创建一个lib目录,然后将这俩个jar包复制进去,然后在build path, 然后add to build path
相关文章推荐
- lucene简介 创建索引和搜索初步
- lucene全文搜索之四:创建索引搜索器、6种文档搜索器实现以及搜索结果分析(结合IKAnalyzer分词器的搜索器)基于lucene5.5.3
- 搜索引擎系列 ---lucene简介 创建索引和搜索初步
- lucene简介 + 创建索引和搜索初步 ——转自robert
- Lucene.Net核心类简介,创建索引,搜索,Lucene高亮组建演示,Rss获得最新帖子,只索引帖子的有意义部分,在AddDocument之前先移除旧有文档.
- lucene全文搜索之四:创建索引搜索器、6种文档搜索器实现以及搜索结果分析(结合IKAnalyzer分词器的搜索器)基于lucene5.5.3
- 搜索引擎系列 -lucene简介 创建索引和搜索初步步骤
- 关于Lucene以及索引和搜索的流程
- 使用lucene3.6创建索引和实现简单搜索
- lucene3.0+版本中文分词测试+搜索结果+创建索引测试
- Lucene实战(二)索引业务bean以及搜索结果高亮
- lucene4.6索引创建和搜索例子
- 【Lucene3.6.2入门系列】第14节_SolrJ操作索引和搜索文档以及整合中文分词
- Lucene介绍和创建索引和搜索初步
- Lucene创建索引与搜索索引
- Lucene创建索引及搜索
- Lucene.Net在创建好索引文件内搜索
- 利用Lucene.net搭建站内搜索(3)---创建索引
- lucene4.6索引创建和搜索例子
- 【Lucene3.6.2入门系列】第14节_SolrJ操作索引和搜索文档以及整合中文分词