ELK学习总结(1-3)倒排索引
2017-03-18 20:25
113 查看
1、倒排索引(反向索引)
一种索引方法,用来存储在全文检索下某个单词在一个/组文档中的存储位置。
常规索引,文档->关键词,费时,得把一个文档全部遍历一遍
倒排索引,关键词->文档,全文搜索过程如下:
1、构建单词集合:
先对文档进行分词,
然后筛选过滤,
得到单词集合,并编号id
2、构建文档集合:文档id
3、建立单词、文档矩阵, 得出倒排索引,如:
乔布斯:{(文档1,<位置3,位置11>),2次}, {(文档2,<位置7>),1},{(文档3,<位置9>),1}
苹果:{(文档1,<位置16>),1次}, {(文档5,<1>),1次}
一种索引方法,用来存储在全文检索下某个单词在一个/组文档中的存储位置。
常规索引,文档->关键词,费时,得把一个文档全部遍历一遍
倒排索引,关键词->文档,全文搜索过程如下:
1、构建单词集合:
先对文档进行分词,
然后筛选过滤,
得到单词集合,并编号id
2、构建文档集合:文档id
3、建立单词、文档矩阵, 得出倒排索引,如:
乔布斯:{(文档1,<位置3,位置11>),2次}, {(文档2,<位置7>),1},{(文档3,<位置9>),1}
苹果:{(文档1,<位置16>),1次}, {(文档5,<1>),1次}
相关文章推荐
- 大数据学习总结(5)参考elk技术架构
- ELK学习总结(4-1)elasticsearch更改mapping(不停服务重建索引)
- ELK学习8_ELK数据流传输过程_问题总结1
- ELK学习8_ELK数据流传输过程_问题总结1
- ELK学习9_ELK数据流传输过程_问题总结2
- ELK学习总结(3-1)elk的基本查询
- ELK学习9_ELK数据流传输过程_问题总结2
- VC学习资料收集(10):udp服务器设计过程总结
- 软件工程学习总结
- 前一段时间的学习总结
- 我的学习总结
- good,JSP学习经验总结
- 老猫的ASP.NET学习总结
- 学习ejb并配置一个简单的helloEjb是遇到问题后总结的经验。
- 一些C++连接,以及个人的C++学习总结。
- VC实例学习 (1):总结下今天学习的东西
- 2001 Microsoft Tech Ed (Beijing 2001/9/7 – 2001/9/9)学习总结
- 在自己学习stuts是遇到问题后总结的经验。
- 蛙蛙推荐:蛙蛙学习asp.net总结(之一)
- 结合本人学习,总结一些C#和JAVA的不同这处