Lucene 4.0 原理与代码分析
2012-09-05 16:09
253 查看
Lucene是全世界最优秀的全文搜索引擎之一,其鼎鼎大名只要是对搜索有一定了解的朋友都一定会有所耳闻,他有着非常优秀的性能和可扩展性,因此有很多身份显赫的后代,比如Solr和Nutch,都是apache基金会下的顶级项目,其已成为工业搜索引擎的基础,可谓是搜索引擎的“事实标准”;于此同时,由于apache基金会的优良运作以及apache开源协议的友好支持,成千上万的搜索技术发烧友和爱好者为Lucene做着默默的贡献,使其日渐完善并又不断进步着,学术界亦对其有着很大的兴趣,众多以学术研究为目的的修改和在发行版被开发出来,在各评测比赛中大放异彩,其中不乏比较优秀的Ivory等;Lucene起到了沟通学术界与工业界的作用。
作为像我这样的信息检索的爱好者,Lucene是一个必须要好好研究的对象和工具,它就像一个引路者,指引着我向宝藏进发,沿途并不枯燥,时常能捡到一些检索技术的知识、一些高效算法和数据结构的知识、或是Java编程的技巧、甚至是代码和文档书写规范;最终的宝藏是一把顺手的利器,助我披荆斩棘,向更神秘的未知世界开拔!
2012年8月14日,Lucene迎来了第4.0次的华丽蜕变,也是一个新的宝藏摆在面前,于是我又上路了……
我想,或许是为了寻找同在这条路上朋友们的共鸣,或者只是记录这些点滴的收获,特开一个系列记录文章,望有朋自远方来,必不亦乐乎!
1. 向量空间模型(VSM) [2012年9月11日更新]
原文链接:http://kevinma.cn/technology/lucene-4-analysis/2012-09-05
作者:KeViNOne
主页:http://kevinma.cn
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接及作者主页链接,否则保留追究法律责任的权利。
作为像我这样的信息检索的爱好者,Lucene是一个必须要好好研究的对象和工具,它就像一个引路者,指引着我向宝藏进发,沿途并不枯燥,时常能捡到一些检索技术的知识、一些高效算法和数据结构的知识、或是Java编程的技巧、甚至是代码和文档书写规范;最终的宝藏是一把顺手的利器,助我披荆斩棘,向更神秘的未知世界开拔!
2012年8月14日,Lucene迎来了第4.0次的华丽蜕变,也是一个新的宝藏摆在面前,于是我又上路了……
我想,或许是为了寻找同在这条路上朋友们的共鸣,或者只是记录这些点滴的收获,特开一个系列记录文章,望有朋自远方来,必不亦乐乎!
文章列表:
一、检索模型与相似度评分算法1. 向量空间模型(VSM) [2012年9月11日更新]
原文链接:http://kevinma.cn/technology/lucene-4-analysis/2012-09-05
作者:KeViNOne
主页:http://kevinma.cn
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接及作者主页链接,否则保留追究法律责任的权利。
相关文章推荐
- Lucene 4.0 原理与代码分析 - 相似度评分算法之向量空间模型(VSM)
- Lucene 3.0 原理与代码分析
- Lucene相似搜索组件MoreLikeThis原理与代码分析
- Lucene原理与代码分析
- Lucene 原理与代码分析完整版
- 免费的Lucene 原理与代码分析完整版下载
- Lucene原理与代码分析
- Lucene 3.0 原理与代码分析
- Lucene 原理与代码分析完整版
- Apache Lucene 评分原理及代码分析
- 《Lucene 原理与代码分析》完整版
- Lucene原理与代码分析
- Lucene原理与代码分析
- Lucene原理与代码分析解读笔记
- Lucene 原理与代码分析完整版
- Lucene 原理与代码分析完整版(转)
- 读《Lucene_3.0_原理与代码分析》
- Lucene 3.0 原理与代码分析
- Openvswitch原理与代码分析(3): openvswitch内核模块的加载
- linux中断底半部之 softirq 原理与代码分析