搜索系统18:lucene索引文件结构
2017-11-16 13:40
246 查看
1.多文件索引与复合索引的区别
2.segments(段)文件
3.段元数据
.si 保存了索引段的元数据信息
4.fnm(域名)文件
相当于solr里的schemal.xml文件
5.项词典(.TIS、TII)文件
lucene老版本的项词典是tis文件,新版本是tim文件,如图:
我没在这个文件里找到字段名,可能已经转成了数值。
《lucene in Action》里有对这几个文件结构介绍的图:
有资料说.tim文件中存储着每个域中Term的统计信息且保存着指向.doc, .pos, and .pay 索引文件的指针。
.tip文件保存着Term 字典的索引信息,可支持随机访问。
6.域存储文件
.fdt 存储域内容
.fdx 文件包含了简单的索引信息,该信息用来将该域对应的文档号保存至.tdt文件中的对应位置。
7.锁文件
write.lock 防止多个IndexWriter同时写到一份索引文件中。
8.索引字段加权因子
.nvd, .nvm
.nvm 文件保存索引字段加权因子的元数据
.nvd 文件保存索引字段加权数据
2.segments(段)文件
3.段元数据
.si 保存了索引段的元数据信息
4.fnm(域名)文件
相当于solr里的schemal.xml文件
5.项词典(.TIS、TII)文件
lucene老版本的项词典是tis文件,新版本是tim文件,如图:
我没在这个文件里找到字段名,可能已经转成了数值。
《lucene in Action》里有对这几个文件结构介绍的图:
有资料说.tim文件中存储着每个域中Term的统计信息且保存着指向.doc, .pos, and .pay 索引文件的指针。
.tip文件保存着Term 字典的索引信息,可支持随机访问。
6.域存储文件
.fdt 存储域内容
.fdx 文件包含了简单的索引信息,该信息用来将该域对应的文档号保存至.tdt文件中的对应位置。
7.锁文件
write.lock 防止多个IndexWriter同时写到一份索引文件中。
8.索引字段加权因子
.nvd, .nvm
.nvm 文件保存索引字段加权因子的元数据
.nvd 文件保存索引字段加权数据
相关文章推荐
- [搜索]Lucene仿百度文库文件检索系统
- 博客系统(搜索利用Lucene)
- 基于Lucene.Net包装的傻瓜索引搜索系统
- 搜索系统19:lucene索引的五个关键知识点
- 搜索系统13:一个查询从solr到lucene都干了些什么事?
- 记一次企业级爬虫系统升级改造(五):基于JieBaNet+Lucene.Net实现全文搜索
- 基于Lucene5.4的本地文件搜索系统
- Lucene构建网站搜索系统
- 利用lucene给网站、系统增加搜索功能
- 国内首套Lucene4.X实战类baidu搜索的大型文档海量搜索系统(分词、过滤、排序、索引)
- 记一次企业级爬虫系统升级改造(五):基于JieBaNet+Lucene.Net实现全文搜索
- springmvc+mybatis+lucene4文档搜索系统(支持分页)
- 搜索系统:全文检索(lucene、排序、多域搜索、高亮、分页、监听器)
- 使用Lucene+Paoding构建SSH系统的站内搜索
- 使用Lucene+Paoding构建SSH2系统的站内搜索---
- 使用Lucene+Paoding构建SSH2系统的站内搜索
- Lucene4.X实战类baidu搜索的大型文档海量搜索系统
- 记一次企业级爬虫系统升级改造(五):基于JieBaNet+Lucene.Net实现全文搜索
- 关于Lucene以及索引和搜索的流程
- Android核心分析之(18)Android电话系统之RIL-Java