您的位置:首页 > 其它

lucene-理解索引过程

2009-12-25 22:24 162 查看
1、索引一个文件调用lucene公用API的方法完成

2、

1)转换为文本:数据必须转换成Lucene能够处理的格式-纯文本字符流

提取的数据创建Lucene的Document对象及其对应的Field对象。

2)分析:完成了对索引数据的预处理,创建了带有若干域的Document对象,可以调用IndexWriter的addDocument(Document)方法,将数据传给Lucene进行索引操作。

进行索引处理时,会首先分析数据使之适合于索引,分成一些大块或语汇单元,然后对它们执行可选的操作。

3)将分析过后的数据写入索引,使用倒排索引技术进行存储,可快速回答“哪些文档包含词X”
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: