在互联网的世界里,我们只是一只小小的网络爬虫(Spider)
2012-05-17 00:37
459 查看
在互联网的世界里,我们只是一只小小的网络爬虫(Spider)。
从打开电脑,连上宽带的那一刻起,我们便开始了漫无边际的Surf,在这个看似虚拟又那么真实的网络世界里,我们并不知道终点在哪里,也不清楚自己此刻身在何处,更多的是像一只小小的Spider,从一个种子URL开始,不断的抓取新的URL加入到待抓取的队列中,有时候我们网上冲浪的方式采用的是基于栈的深度优先访问方式,有时候采用的是基于队列的广度优先访问方式。
不经意间,桌面窗口右下方毫无征兆地弹出一个小窗口,它不需要经过你的同意,这个小小的弹出窗口只不过是一次又一次地提醒你“世界上没有免费的午餐”。小窗口中的内容依然是那么的诱人,鼠标再次滑向了它,此刻,爬虫开始了没有目的地的旅程。
从一个URL跳到另一个URL,看着那些似乎关己,又无能为力的东西,或喜或悲,或怒或怨,偶尔停下来稍作消息,这在浩瀚的世界里留下一点声音,可是那是多么的微不足道。
网络带给了我们爆炸的信息量,就像无数发射向你的子弹,无处可逃。你以为你是在上网,结果发现恰好相反。
也许有一天,我们不再漫无目的地在互联网的大千世界里爬行,我们只关注那些“优质”的内容,就像一只“垂直爬虫”,只抓取主题相关的网页,然而我们还是免不了像爬虫一样继续没日没夜的穿梭于这大千世界,至少现在是这样。
-------------------------------------------------------
< 转载请注明:http://blog.csdn.net/icvpr >
相关文章推荐
- 高级爬虫工程师(Spider)-美团网-拉勾网-最专业的互联网招聘平台
- 抢先式多线程网络爬虫spider在智能搜索引擎中的实现
- 网络爬虫(spider)程序的编程实现
- 网络爬虫之Spider
- 我是一只小小爬虫(Python编程)--第1节 什么是爬虫
- 一只简单的网络爬虫(基于linux C/C++)————线程相关
- 互联网世界的毒瘤——僵尸网络
- 一只简单的网络爬虫(基于linux C/C++)————守护进程
- 永信至诚:乌镇世界互联网大会闭幕 网络安全人的使命刚刚启航
- 一只简单的网络爬虫(基于linux C/C++)————开篇
- 一个简单的java网络爬虫(spider)
- 一只简单的网络爬虫(基于linux C/C++)————socket相关及HTTP
- 一只简单的网络爬虫(基于linux C/C++)————浅谈并发(IO复用)模型
- 我们为您搜索到了60个Java语言网络爬虫相关源代码资料
- 一只简单的网络爬虫(基于linux C/C++)————配置文件设计及读取
- 一只简单的网络爬虫(基于linux C/C++)————支持动态模块加载
- 一只简单的网络爬虫(基于linux C/C++)————利用正则表达式解析页面
- 一个简单的java网络爬虫(spider)
- 假如世界的互联网瘫痪了,我们的隐私该怎么办?
- 一只简单的网络爬虫(基于linux C/C++)————主事件流程