找回密码
 注册加入

扫一扫,极速登录

QQ登录

只需一步,快速开始

搜索
查看: 3505|回复: 1

网站优化适度屏蔽“蜘蛛”有益无害

[复制链接]
发表于 2011-6-11 22:45:06 | 显示全部楼层 |阅读模式
  网站优化做的是使搜索引擎快速索引页面,从而增加权重和访问量。由此站长喜欢蜘蛛将网站爬个遍,吃个透。但是让蜘蛛肆无忌惮的去爬行真的就有益于网站优化吗?很多站长在robotts.txt文本中可能除了ADMIN、DATA目录限制蜘蛛爬行,其他目录任蜘蛛索引。笔者要说,做网站优化除了一些安全目录外再应适度屏蔽一些目录,禁止搜索引擎的索引是有益无害的。
  一:图片目录的屏蔽
  图片是构成网站组成的主要元素,然而主题模板中类似的图片在搜索引擎中铺天盖地,搜索引擎一遍遍的索引下去还会进行收录吗?即使收录了,所带的效果也是微乎其微的。一个不错的网站,每天各式各样的蜘蛛加起来来访不下几千次,无疑是浪费了大量的带宽。一般我们常屏蔽的目录为“images、images”。

  二:缓存目录的屏蔽
  很多程序都具有缓存目录,拿z-blog这个程序来举例子,它的缓存目录为“CACHE”,其中会有着不少已经生成HTML的缓存文件。如果蜘蛛继续进行索引的话,无疑是造成了重复内容的索引,这对网站是有害无益的。看到不少使用Z-blog的朋友都没有进行设置,可能是没有引起足够的重视吧。当然,其他程序还有这各自不同的缓存目录,针对性的进行屏蔽才最为适宜。
  三:模板目录的屏蔽
  对于程序的模板,大多站长都选择了直接套用而非独立模板。模板的高度重复性也成为了一个搜索引擎中信息的冗余,因此利用Robots.txt来进行模板的屏蔽也是有益无害的。且模板文件常常与生成文件高度相似,同样易造成雷同内容的出现。
  四:CSS目录的屏蔽
  CSS目录,搜索引擎抓取无用,所以我们在设置Robots.txt文件中将其进行屏蔽,以提高搜索引擎的索引质量。为搜索引擎提供一个简洁明了的索引环境更易提升网站友好性。
  五:部分程序的RSS页
  此条只针对存在RSS页的程序来讲,一般博客中比较常见。此页面可以说是一个高度重复的页面,完全有必要进行屏蔽,以增强网站在搜索引擎中的友好性。
  六:屏蔽双页面的内容
  一个可以生成静态页面的网站,一般来说动态页面也是可以访问的。如:“www.XXXX/1.html与www.xxxxx/asp?id=1”,两者若被搜索引擎完全索引,无疑是访问到了完全一致的内容,对搜索引擎友好性来说是有害无益的。而我们屏蔽的往往都是后者,因为前者页面为静态,更易被搜索引擎索引收录。
  七:涉及程序安全页
  在起始位置我们交代了屏蔽ADMIN、DATA目录,防止安全目录与数据库泄露。另外数据库目录、网站日志目录、备份目录都是需要进行屏蔽的,都是可以有效减少“泄密”现象的发生。
  八:屏蔽文件形式
  一些站长总是喜欢将网站备份后方到网站下载后忘记删除,或者根本不做下载,直接保留到服务器。但是大家都知道,网站发展壮大必定受到一些人的窥视,网站一次次的被尝试下在数据库、备份文件,稍微有点名次的网站都会受到类似的攻击。利用robots.txt屏蔽类似“rar、zip”等类似的文件。实质上,这样的屏蔽方式更有益于“第七点”,但是做到的仍然只是局部。
  总结:适度做一下屏蔽蜘蛛的优化不仅可以节省我们服务器的资源,同时也可以增加搜索引擎对网站的友好性,何乐而不为呢?二进制网络携手专业网站建设公司引航科技(www.joyweb.net.cn)认为:robots.txt文件不仅仅是屏蔽安全目录的工具,优化得当更利于网站对搜索引擎的优化。

发表于 2011-6-11 23:49:26 | 显示全部楼层
如何屏蔽呢?给新手简述下方法吧,不然看了干着急
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册加入  

本版积分规则

Archiver|手机版|小黑屋|Discuz!扩展中心 ( 浙ICP备14042422号-1 )|网站地图QQ机器人

GMT+8, 2024-5-21 03:21 , Processed in 0.168747 second(s), 14 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表