自己动手写网络爬虫
2015-11-16 16:04
429 查看
目前,互联网上的信息迅速膨胀。当你在网上冲浪时,你是否知道还有一类特殊的网络用户也在Internet上默默地工作着,它们就是网络爬虫。这些网络爬虫按照设计者预定的方式,在网络中穿梭,同时自动收集有效的信息,然后进行分类和整理,将整理结果提供给用户,以方便用户查找他们感兴趣的内容。由于网络爬虫的实用性,引起了很多程序员,特别是Web程序员的兴趣。
但是很多网络爬虫的开发原理与技巧在专业的公司内部秘而不宣。至今仍然缺少理论与实践结合的专门讲网络爬虫的书籍。本书尝试先介绍原理,接着是具体的代码实现分析。本书相关的代码在附带光盘中可以找到,本书两位主要作者在搜索引擎领域都有理论和实践经验。
该书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。在作者写这本书的时期,搜索引擎开发人员仍然很稀缺。作者真诚的希望通过本书把读者带入搜索引擎开发的大门并认识更多的朋友。
http://item.jd.com/10400758.html http://product.dangdang.com/20949741.html
但是很多网络爬虫的开发原理与技巧在专业的公司内部秘而不宣。至今仍然缺少理论与实践结合的专门讲网络爬虫的书籍。本书尝试先介绍原理,接着是具体的代码实现分析。本书相关的代码在附带光盘中可以找到,本书两位主要作者在搜索引擎领域都有理论和实践经验。
该书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关研究人员也有一定参考价值,同时猎兔搜索技术团队也已经开发出以本书为基础的专门培训课程和商业软件。在作者写这本书的时期,搜索引擎开发人员仍然很稀缺。作者真诚的希望通过本书把读者带入搜索引擎开发的大门并认识更多的朋友。
http://item.jd.com/10400758.html http://product.dangdang.com/20949741.html
相关文章推荐
- 【转】TCP协议中的三次握手和四次挥手(图解)
- 网络流
- 轻松把玩HttpClient之配置ssl,采用设置信任自签名证书实现https
- 不同框架实现的WebService的服务端获取HttpServletRequest的方法
- Heritrix3.3.0源码阅读 URI过滤规则
- BAT解密:互联网技术发展之路(7)- 网络层技术剖析
- HTTPURLConnection中接收数据流
- [Android_机制]_Http和Socket连接区别
- [TCPIP] 传输控制协议 Note
- [TCPIP] 传输控制协议 Note
- [TCPIP] DNS Note
- Http与Socket
- [TCPIP] DNS Note
- [TCPIP] IP路由表及选路 Note
- [TCPIP] IP路由表及选路 Note
- Android 网络通信
- [TCPIP] 分层 Note
- 接口测试培训:HTTP协议基础
- 2015-11-16亲测58可用httpwebrequest模拟登陆方法
- BAT解密:互联网技术发展之路(7)- 网络层技术剖析