构建自己的搜索引擎(lucene,hadoop,nutch)
2010-09-27 23:45
609 查看
lucene,hadoop,nutch有用过么?
如果大家积极,我可以写一个简单的说明文档,能让大家在自己的机器上构建一个类似google的搜索引擎。说明如下:
lucene:一个java的开源包,做底层的信息检索
hadoop:一个google file system的实现。可以完成如下的功能,让很多台机器的硬盘合成为一个大的硬盘,而且有冗余等功能。
nutch:一个建立在lucene,hadoop上的开源搜索引擎。可以构建自己的搜索引擎。
这个包对于刚学编程的同学来说太难了。但是对于计算机系的同学有很多好处。分布式文件系统能让你们了解底层的os对文件系统怎么处理,另外信息检索也是最近很红的一个方向。可以面google,百度。不夸张说,你把所有所有内部结构搞明白。基本出去计算机公司可以随便日了
如果大家积极,我可以写一个简单的说明文档,能让大家在自己的机器上构建一个类似google的搜索引擎。说明如下:
lucene:一个java的开源包,做底层的信息检索
hadoop:一个google file system的实现。可以完成如下的功能,让很多台机器的硬盘合成为一个大的硬盘,而且有冗余等功能。
nutch:一个建立在lucene,hadoop上的开源搜索引擎。可以构建自己的搜索引擎。
这个包对于刚学编程的同学来说太难了。但是对于计算机系的同学有很多好处。分布式文件系统能让你们了解底层的os对文件系统怎么处理,另外信息检索也是最近很红的一个方向。可以面google,百度。不夸张说,你把所有所有内部结构搞明白。基本出去计算机公司可以随便日了
相关文章推荐
- windows构建网页版搜索引擎 Nutch+Lucene+Mysql+Tomcat(二)
- 自己动手写搜索引擎(常搜吧历程七#解析文档之WORD#)(Java、Lucene、hadoop)
- 构建自己的搜索引擎之Lucene详解
- Lucene+nutch构建垂直搜索引擎
- 自己动手写搜索引擎(常搜吧历程六#解析文档之PDF#)(Java、Lucene、hadoop)
- 【Nutch2.3基础教程】集成Nutch/Hadoop/Hbase/Solr构建搜索引擎:安装及运行【集群环境】
- 自己动手写搜索引擎(常搜吧历程二#索引#)(Java、Lucene、hadoop)
- windows构建网页版搜索引擎 Nutch+Lucene+Mysql+Tomcat(一)
- 自己动手写搜索引擎(常搜吧项目展示)(Java、Lucene、hadoop)
- 利用Lucene与Nutch构建简单的全文搜索引擎
- 自己动手写搜索引擎(常搜吧历程三#搜索二#)(Java、Lucene、hadoop)
- 自己动手写搜索引擎(常搜吧历程四#分词#)(Java、Lucene、hadoop)
- 自己动手写搜索引擎(常搜吧历程一#认识Lucene#)(Java、Lucene、hadoop)
- 自己动手写搜索引擎(常搜吧项目展示)(Java、Lucene、hadoop)
- 自己动手写搜索引擎(常搜吧历程四#分词#)(Java、Lucene、hadoop)
- 自己动手写搜索引擎(常搜吧历程五#解析文档之XML#)(Java、Lucene、hadoop)
- 自己动手写搜索引擎(常搜吧历程三#搜索#)(Java、Lucene、hadoop)
- 自己动手搭建搜索引擎(基于Nutch1.0) lucene 很简单,已成功
- 自己动手写搜索引擎(常搜吧历程七#解析文档之HTML#)(Java、Lucene、hadoop)
- 【Nutch2.3基础教程】集成Nutch/Hadoop/Hbase/Solr构建搜索引擎:安装及运行【集群环境】 分类: 1_Nutch 0_jediael开发 2015-01-24 17:24 3522人阅读 评论(1) 收藏