Lucene40PostingWriter
2015-06-11 18:03
183 查看
控制freq和prox这两个文件的输出,比较简单。
默认skip interval这是16,max skip level这是10.
由源或使用可见VInt编码(而不是速度的传奇PForDelta)。
当存储的文档docid名单delta,假设不存文档频率,是一个delta,存的话假设是1则是(delta << 1) | 1,否则就是两个vint了(delta << 1和termDocFreq)。
最后缓存跳跃表结构。
存位置也类似,只是position是看是否存payload,payloadlength是否和上次一样,offset则是看是否存offset,offsetlength是否也是最后一次。假设有payload,上次写payload。
加分后term,写入跳过表结构(它应该是在tim文件)。
一个段的所有文件,等都加完,来电flushTermsBlock,第一次去RamOutputStream写字典freqStart,proxStart,skipStart信息,最后flush进入tip文件。
默认skip interval这是16,max skip level这是10.
由源或使用可见VInt编码(而不是速度的传奇PForDelta)。
当存储的文档docid名单delta,假设不存文档频率,是一个delta,存的话假设是1则是(delta << 1) | 1,否则就是两个vint了(delta << 1和termDocFreq)。
最后缓存跳跃表结构。
存位置也类似,只是position是看是否存payload,payloadlength是否和上次一样,offset则是看是否存offset,offsetlength是否也是最后一次。假设有payload,上次写payload。
加分后term,写入跳过表结构(它应该是在tim文件)。
一个段的所有文件,等都加完,来电flushTermsBlock,第一次去RamOutputStream写字典freqStart,proxStart,skipStart信息,最后flush进入tip文件。
相关文章推荐
- 如何通过rsync+sersync 实现同步备份
- 一个在线看android系统各个版本源码的链接
- Java调用Python
- Spark 学习笔记:(二)编程指引(Scala版)
- oc中文转字符串
- 一些恶搞的bat小脚本
- 如何在真机上调试Android应用程序(图文详解)
- sublime自动缩进排版
- hdu 5241 数学题= =
- 使用mutt发送邮件
- 深入理解JVM--JVM垃圾回收机制
- 正则表达式在IOS开发中的应用
- httpclient https忽略证书直接请求
- Linux 一些命令记录
- 欢迎使用CSDN-markdown编辑器
- XML基础
- 你的灯亮着吗读后感一
- LeetCode 之 Valid Palindrome — C 实现
- git常用命令和ViM编辑器----源于培训笔记
- java中用StringBuffer写文件实现自动换行