再谈使用CDN技术对网站收录的影响
2012-04-07 22:31
246 查看
在谈论CDN对收录影响之前,有必要谈谈什么是CDN,估计很多人都不大明白。所谓CDN即内容分发网络(Content Delivery Network),该技术通俗点讲就是把内容分发到离用户最近的地方(当然是最容易最快速获取的地方),一般来说会涉及到内容推送、智能DNS解析、负载均衡等技术。(遗憾的是CDN早期发明者之一的Daniel C. Lewin在2001年“911”恐怖袭击中的不幸遇难)
CDN技术使得我们的网站(或者我们的业务、我们的应用)在多个用户看来好像有不同的IP地址。根据百度的说辞,百度蜘蛛就象一个普通用户一样,其实这是有偏差的,普通用户看到的和百度蜘蛛看到的是不同的,至少目前来说百度蜘蛛是看不到JS执行后的效果,也看不到FLASH渲染后的效果。百度蜘蛛使用的是域名的缓存地址,这个IP地址经测试一般有一天左右的延迟,当然可能和站点的重要性(姑且称之为权重吧)有关。因此当你刚开始使用CDN的时候,百度蜘蛛还是会去旧服务器去爬,而不会去你的CDN节点去爬,蜘蛛发现地址变化后会不适应的,先要看看是不是真的变化了,两边都要去爬爬看。确信真的是变化了,就会去新的CDN节点去爬。由于一般的用户都不会自己去建CDN网络,因此CDN节点的变动可能会影响蜘蛛的爬行,由此可能会影响站点收录。
我们在网上经常看到有人在讨论CDN技术到底会不会影响站点收录,会不会造成站点降权,大多数人的观点是否定的,而我给出的观点是肯定的,肯定会被降权。我们都知道,谁都喜欢稳定的,百度蜘蛛也不例外。当你的站点地址变化了,这对蜘蛛来讲是非常大的变化,它肯定会不适应,不适应怎么办?就是降权,等你稳定了我再来。对于大网站,权重高的站点,百度蜘蛛会认为稳定的时间会很快,一般最多一周就会恢复;而对小站,权重低的站点,百度蜘蛛会认为稳定的时间会比较长,一般需要一个月的考察期。这对于大多数中小站长来说,真的是伤不起啊。好了,大家看张图片再说。
![](http://bbs.chinaz.com/handler.aspx?max_handler=down&action=attach&mode=image&id=217048&s=1)
本图片来源:http://www.playtigers.com/article/12/8711.html
那我们怎么应对由于使用CDN技术而造成百度蜘蛛对我们站点的误伤呢?很简单,我们可以使用智能DNS来对指导DNS的爬行。具体来说就是我们要准备一个永远不变地址的机器,让蜘蛛永远来爬这个机器,而不是爬那些CDN节点机器,这样就可以了。目前DNSPOD是支持的,该服务能识别哪些是蜘蛛。当然我们自己也可以在服务器上设置,不过这是大多数站长无法做到的。在此不做叙述。
提到这里了,我想再提醒大家,最近发现一个友情链接的案例。某个站点利用智能DNS,让我们普通用户看到他已经把我们的站点加入到友情链接了,但在蜘蛛看来却没有。那我们如何识别呢?很简单,你可以利用模拟蜘蛛程序(如http://tool.chinaz.com/Tools/Robot.aspx)去看看,是否有我们的链接,如果没有,很遗憾,你上当了。
CDN技术使得我们的网站(或者我们的业务、我们的应用)在多个用户看来好像有不同的IP地址。根据百度的说辞,百度蜘蛛就象一个普通用户一样,其实这是有偏差的,普通用户看到的和百度蜘蛛看到的是不同的,至少目前来说百度蜘蛛是看不到JS执行后的效果,也看不到FLASH渲染后的效果。百度蜘蛛使用的是域名的缓存地址,这个IP地址经测试一般有一天左右的延迟,当然可能和站点的重要性(姑且称之为权重吧)有关。因此当你刚开始使用CDN的时候,百度蜘蛛还是会去旧服务器去爬,而不会去你的CDN节点去爬,蜘蛛发现地址变化后会不适应的,先要看看是不是真的变化了,两边都要去爬爬看。确信真的是变化了,就会去新的CDN节点去爬。由于一般的用户都不会自己去建CDN网络,因此CDN节点的变动可能会影响蜘蛛的爬行,由此可能会影响站点收录。
我们在网上经常看到有人在讨论CDN技术到底会不会影响站点收录,会不会造成站点降权,大多数人的观点是否定的,而我给出的观点是肯定的,肯定会被降权。我们都知道,谁都喜欢稳定的,百度蜘蛛也不例外。当你的站点地址变化了,这对蜘蛛来讲是非常大的变化,它肯定会不适应,不适应怎么办?就是降权,等你稳定了我再来。对于大网站,权重高的站点,百度蜘蛛会认为稳定的时间会很快,一般最多一周就会恢复;而对小站,权重低的站点,百度蜘蛛会认为稳定的时间会比较长,一般需要一个月的考察期。这对于大多数中小站长来说,真的是伤不起啊。好了,大家看张图片再说。
本图片来源:http://www.playtigers.com/article/12/8711.html
那我们怎么应对由于使用CDN技术而造成百度蜘蛛对我们站点的误伤呢?很简单,我们可以使用智能DNS来对指导DNS的爬行。具体来说就是我们要准备一个永远不变地址的机器,让蜘蛛永远来爬这个机器,而不是爬那些CDN节点机器,这样就可以了。目前DNSPOD是支持的,该服务能识别哪些是蜘蛛。当然我们自己也可以在服务器上设置,不过这是大多数站长无法做到的。在此不做叙述。
提到这里了,我想再提醒大家,最近发现一个友情链接的案例。某个站点利用智能DNS,让我们普通用户看到他已经把我们的站点加入到友情链接了,但在蜘蛛看来却没有。那我们如何识别呢?很简单,你可以利用模拟蜘蛛程序(如http://tool.chinaz.com/Tools/Robot.aspx)去看看,是否有我们的链接,如果没有,很遗憾,你上当了。
相关文章推荐
- CDN对网站自然排名有什么影响吗
- 外部链接对网站收录的影响至关重要
- web网站加速之CDN(Content Delivery Network)技术原理
- 好的技术网站收录
- 使用CDN对动态网站内容加速有效果吗
- SEO技术问答:网站上线一个月了怎么没收录
- StartUp技术交流会:动态内容的CDN缓存、Memcahce的使用
- 自动化测试技术网站--持续收录中...
- 如何更有效使用 Rational AppScan 扫描大型网站,第 1 部分: 工作原理及技术分析
- 使用Apache的反向代理会影响搜索引擎的收录和排名吗
- 网站请勿随意使用第三方CDN资源调用公开库资源 - 聆听分享网
- SegmentFault 技术周刊 Vol.28 - GitHub 使用攻略 —— 你不得不上的交友网站
- 还为使用google搜索找不到自己要的技术文章吗?彻底解决访问google域名地址搜索网站间歇访问无法找到服务器的问题
- 现如今的CDN网站加速技术,细说CDN
- python3使用builtwith识别网站使用相关技术
- 影响网站收录排名的隐患因素
- 17条网站的隐患,影响你的收录排名
- web网站加速之CDN(Content Delivery Network)技术原理
- 常见网站开发技术之一:使用Log4j进行日志操作
- 黑客技术网站收录