找回密码
 注册加入

扫一扫,极速登录

QQ登录

只需一步,快速开始

搜索
查看: 5674|回复: 2

再浅谈百度抓取时出现的200 0 64现象

[复制链接]
发表于 2011-12-7 16:17:30 | 显示全部楼层 |阅读模式

  只有经历过网站关键词搜索排名跌宕起伏的站长才能真正明白,等待不是一种方式,结果需要努力和勤劳来弥补。笔者经历了网站改版到降权,关键词一无所有到关键词排名起色的过程,这个过程让人难熬和艰辛,如果有一天每一位站长都经历过这样的历程,我想百度会比现在弱小很多。

  笔者的站在近3个月前进行一次改版,改版的目的就是为了URL标准和简单,同时也做了网站网页布局的修改,从改版后开始网站关键词一无所有,等待我的只有坚持内容更新和外链发布,直至上周网站频道关键词和长尾关键词开始进入百名,从网站改版到目前有所成就的过程中经历了很多,其中之一就是被大家蒙上恐怖主义色彩的http状态码200064,在笔者多次的实验和反复的监测中发现几下几点引发因素:


                               
登录/注册后可看大图

  笔者站点GZIP压缩使用情况对比:

  site位置:第一(使用):site位置:第一(停止使用)

  site快照:隔天(使用):site位置:隔天(停止使用)

  domain位置:16位(使用):domain位置:10位(停止使用)

  domain快照:差1天(使用):domain快照:隔天(停止使用)

  网站GZIP压缩使用过程:

  目前各大站长都知道GZIP压缩带来的高速率的访问和良好的用户体验,但笔者认为不同的网站应视网站的情况而使用,GZIP简单的来说就是压缩减少传输给访问者数据量的一种技术,但只针对于静态页面。

  11月12日,由于网站只有网站首页是静态页面,但首页中因为广告图片直接增加了网页的大小,为了提高首页的访问速度,因此要求程序员进行GZIP压缩处理,但就在压缩后第二天笔者发现网站IIS日志中出现大量的200064状态码,其中发现大部分是百度抓取时出现的状态码,当时并没有引起注意,并处理以标记日志正常,继续检测。

  11月26日,笔者一直检测的网站日志仍然出现200 0 64,并由于之前网站已在被降权的过程中,因此domain网站首页保持不变,但持续了近2个月的高质量更新和外链建设到此为什么没有效果呢?笔者在互联网上找了200 0 64所有的解释说明,并最终决定停止GZIP压缩,恢复正常。

  11月26日,停止GZIP压缩,次日百度抓取状态码回复正常,持续时间为半个月。就在11月28日早晨发现,网站domain时上升第十位。

  在此期间笔者的网站site和domain时快照时间均为隔天,因此从以上二点我们可以判断,200064并非网上流传的所谓抓取删除的概念,而是一种抓取不完整的意思,因为压缩传输,因此造成百度抓取无法正常完整的获取网页中所有的内容信息,提醒是完整的获取。因此如果有站长发现网站日志中百度抓取出现这样的问题,而且刚好网站也使用了GZIP压缩,那么停下一段时间,再对比网站日志情况,我想抓取不完整不是百度自身的索引行为问题,但长期的抓取不完整一定会受到一定程度的处罚,笔者建议新站或是在1年以内的站点要多注意200064的情况。

  总结:网站出现200064现象一定有原因引起,通过笔者亲身体验证明该抓取状态并非是网上流传的那么恐怖色彩,站长记录好每一次操作就可以发现这些问题的所在,不是服务器问题就是技术原因。网站就像自己的孩子,总是需要努力的付出和合理的养育,这样网站这个孩子才能茁壮成长!

  本文出自http://www.kidsnet.cn,A5首发,转载请注明来源,并保留来源的完整性,谢谢!


发表于 2012-7-20 17:59:02 | 显示全部楼层
我看不错噢 谢谢楼主 > _ <
Discuz扩展中心 一切皆有可能
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册加入  

本版积分规则

Archiver|手机版|小黑屋|Discuz!扩展中心 ( 浙ICP备14042422号-1 )|网站地图QQ机器人

GMT+8, 2024-5-1 22:43 , Processed in 0.166343 second(s), 13 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表