Lucene全文检索学习总结
2017-01-07 16:29
204 查看
一、Lucene概述
(1)全文检索概述
数据分类
结构化数据:具有固定格式或有限长度的数据 如:数据库中的表 检索方式:SQL语句
非结构化数据:不定长度或无固定格式数据 如:邮件、word文档、网页 检索方式:顺序扫描、全文检索
半结构化数据:如:xml文件、json格式数据
反向索引
由字符串到文件的映射是文件到字符串映射的反向过程。
创建索引需要三步:需要检索的数据(Document)、分词技术(Analyzer)、索引创建(Indexer)
索引检索需要四部:搜索关键字(Keywords)、分词技术(Analyzer)、检索索引(Search)、返回结果
(2)Lucene数学模型
二、网络爬虫
三、搜索后台
四、网页设计
(1)全文检索概述
数据分类
结构化数据:具有固定格式或有限长度的数据 如:数据库中的表 检索方式:SQL语句
非结构化数据:不定长度或无固定格式数据 如:邮件、word文档、网页 检索方式:顺序扫描、全文检索
半结构化数据:如:xml文件、json格式数据
反向索引
由字符串到文件的映射是文件到字符串映射的反向过程。
创建索引需要三步:需要检索的数据(Document)、分词技术(Analyzer)、索引创建(Indexer)
索引检索需要四部:搜索关键字(Keywords)、分词技术(Analyzer)、检索索引(Search)、返回结果
(2)Lucene数学模型
二、网络爬虫
三、搜索后台
四、网页设计
相关文章推荐
- Lucene学习总结(一):全文检索的工作流程
- Lucene学习总结:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- [转摘]Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理 2014-06-25 14:11 666人阅读 评论(0) 收藏
- Lucene学习总结之一:全文检索的基本原理(推荐--arvin)
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- 【转】Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理
- Lucene学习总结之一:全文检索的基本原理