您的位置:首页 > 数据库

建站学习笔记之百度不收录内页的六大原因和对策

2012-02-20 17:54 260 查看
 
网站的SEO和推广,也是我在建站过程中一直学习的地方。因此,也留意了一下搜索引擎的收录情况。

我的小站BCB游戏作坊 http://www.bcbgame.com 开张以来,运气还算不错吧,很快百度就收录了首页。前期也没有怎么打理,也就没有留意这些,近期改版以后,我就开始了大量的原创工作,争取每天都发布真原创的文章,开发手记,学习笔记等。

却发现一个问题,对于这些内页,百度收录极其不稳定,今天收录了几条,明天一看,又没了,变成只有首页了。相信很多站长都有类似的经历。

 

于是查了很多资料,决定按照下面的方法排查一下:

原因1:百度已经索引了但还未放出来排名。百度对文章的收录需要审核时间,蜘蛛抓取成功索引内容录入数据库,需要经过二次审查是否为SPAM然后才放出参与排名,放出的时间与网站权重高低有着直接的关系,百度周期更新才放出收录是新站最为常见的现象。

对策:我们要做的就是保证定期定量的更新、观察网站日志,只要蜘蛛正常爬行,就静心等待着,会有惊喜的。

 

原因2:robots设置问题导致内页不受引擎蜘蛛爬行索引。

对策:检查是否语法错误屏蔽了蜘蛛爬行,其中包括meta robots与nofollow等标签的的设置。

 

原因3:文章原创度问题,头部标签的设置导致页面类似重复,或者采集页面太多,因百度数据库中已经存在大量的相似信息而不收录,长期地操作会导致百度降权。

对策:应该保持文章的原创度(伪原创相信朋友们都熟悉),质量比数量更重要,最好是能每天定时更新让百度对你网站抓取也有守时的好习惯。

 

原因4:网站内部链接存在问题,比如有大量错误链接、不良的网站链接,蜘蛛爬行不通畅无法抓取,不良网址链接导致网站降权。

对策:针对首页、频道等各个重要页面做错误链接检查(可以观察谷歌站长工具的抓取错误),检查留言板、评论等网友互动功能的不良链接,避免与不良网站互链。

原因5:网站使用了黑帽手段,百度识别了欺骗手段整站降权。

对策:远离关键词堆积、群发,黑链等黑帽行为,网站的长期稳定少懂歪脑筋,百度一有动作就没很难挽回了!

 

原因6:服务器无法访问,速度缓慢、被挂马等情况。百度蜘蛛索引内容时,多次识别网站有着大量错乱代码或者遇到服务器无法访问,网站被列入观察名单。

对策:做好网站代码优化提高页面读取速度,选择负责任的安全空间服务商,成熟的网站程序并定期更新补丁,定期对修改文件痕迹做好跟踪。

 

除了踏踏实实地做好以上6点,另外有几点值得去做的:

1、首页做好全站的网站地图,让蜘蛛顺利爬行到内页;

2、内页的相关链接调用一定要规则化,让每个页面的主题更突出;

3、外部链接可适当地做一些内页的蜘蛛引导。

每个细节把握好让自己放下心,相信百度不会远离对我们内页的收录。

 

后续放出学习成果,和现在做一比对,敬请期待....
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息