lucene-理解索引过程
2009-12-25 22:24
162 查看
1、索引一个文件调用lucene公用API的方法完成
2、
1)转换为文本:数据必须转换成Lucene能够处理的格式-纯文本字符流
提取的数据创建Lucene的Document对象及其对应的Field对象。
2)分析:完成了对索引数据的预处理,创建了带有若干域的Document对象,可以调用IndexWriter的addDocument(Document)方法,将数据传给Lucene进行索引操作。
进行索引处理时,会首先分析数据使之适合于索引,分成一些大块或语汇单元,然后对它们执行可选的操作。
3)将分析过后的数据写入索引,使用倒排索引技术进行存储,可快速回答“哪些文档包含词X”
2、
1)转换为文本:数据必须转换成Lucene能够处理的格式-纯文本字符流
提取的数据创建Lucene的Document对象及其对应的Field对象。
2)分析:完成了对索引数据的预处理,创建了带有若干域的Document对象,可以调用IndexWriter的addDocument(Document)方法,将数据传给Lucene进行索引操作。
进行索引处理时,会首先分析数据使之适合于索引,分成一些大块或语汇单元,然后对它们执行可选的操作。
3)将分析过后的数据写入索引,使用倒排索引技术进行存储,可快速回答“哪些文档包含词X”
相关文章推荐
- Lucene入门教程(二)- 理解索引过程的核心类
- Lucene入门教程(二)- 理解索引过程的核心类
- Lucene入门教程(二)- 理解索引过程的核心类
- 理解Lucene索引与搜索过程中的核心类
- 索引、视图、游标、存储过程和触发器的理解
- Lucene学习总结之四:Lucene索引过程分析(3)
- Lucene学习总结之四:Lucene索引过程分析(1)
- Lucene学习总结之四:Lucene索引过程分析(1)
- Lucene教程(三)- 理解搜索过程的核心类
- 第一个lucene程序,把一个信息写入到索引库中、根据关键词把对象从索引库中提取出来、lucene读写过程分析
- 索引、视图、游标、存储过程和触发器理解总结
- Lucene文件格式和索引过程分析
- Lucene索引创建过程
- lucene的搜索过程(索引文件)
- lucene-2.9.0 索引过程(二) FreqProxTermsWriter
- lucene4.7源码研究之索引建立过程(1)
- Lucene生成索引的时候,总是在索引的过程中出现下面的异常信息:(转载)
- Lucene建立索引的过程学习
- Lucene学习总结之四:Lucene索引过程分析(2)
- Lucene 源代码剖析-9 索引创建过程