您的位置:首页 > 理论基础 > 计算机网络

自己动手写网络爬虫

2015-11-16 16:04 429 查看
目前,互联网上的信息迅速膨胀。当你在网上冲浪时,你是否知道还有一类特殊的网络用户也在Internet上默默地工作着,它们就是网络爬虫。这些网络爬虫按照设计者预定的方式,在网络中穿梭,同时自动收集有效的信息,然后进行分类和整理,将整理结果提供给用户,以方便用户查找他们感兴趣的内容。由于网络爬虫的实用性,引起了很多程序员,特别是Web程序员的兴趣。

但是很多网络爬虫的开发原理与技巧在专业的公司内部秘而不宣。至今仍然缺少理论与实践结合的专门讲网络爬虫的书籍。本书尝试先介绍原理,接着是具体的代码实现分析。本书相关的代码在附带光盘中可以找到,本书两位主要作者在搜索引擎领域都有理论和实践经验。

该书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。在作者写这本书的时期,搜索引擎开发人员仍然很稀缺。作者真诚的希望通过本书把读者带入搜索引擎开发的大门并认识更多的朋友。


http://item.jd.com/10400758.html http://product.dangdang.com/20949741.html
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: