您的位置:首页 > 其它

ELK学习总结(1-3)倒排索引

2017-03-18 20:25 113 查看
1、倒排索引(反向索引)

一种索引方法,用来存储在全文检索下某个单词在一个/组文档中的存储位置。

常规索引,文档->关键词,费时,得把一个文档全部遍历一遍

倒排索引,关键词->文档,全文搜索过程如下:

    1、构建单词集合:

先对文档进行分词,

然后筛选过滤,

得到单词集合,并编号id

2、构建文档集合:文档id

3、建立单词、文档矩阵, 得出倒排索引,如:

乔布斯:{(文档1,<位置3,位置11>),2次}, {(文档2,<位置7>),1},{(文档3,<位置9>),1}

苹果:{(文档1,<位置16>),1次}, {(文档5,<1>),1次}

      
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: