站长之家

欢迎光临站长之家,本博客为站长提供学习交流的场所!

« 非国家级网站不得以“中国”等字头命名百度相关搜索打不开了 »

如何才能防采集-也谈“最有效的3种防采集方法”

    防采集的文章网络上有很多,但大多数方法效果不理想,有些防采集效果是不错,但防采集的同时却不利于搜索引擎收录,更有甚者会被搜索引擎疑为作弊,有被K的危险。而现在的网站很少能脱离搜索引擎活着,即使是像新浪这样的大门户,从搜索引擎来的流量也占很大比例(当然,新浪就是作弊也不会被K的,呵呵),何况一般的个人网站,80%的流量都是靠搜索引擎贡献。

前天在站长站上看到一篇文章叫:目前最有效的3种防采集方法,感觉归纳得不错,拿来分析下,再加上几点我的体会

这3种方法是:

  一、建立多个模板 并随机调用
  二、建立采集者IP库
  三、使用防采集控件


  一、建立多个模板 并随机调用

  优点:此方法比较实用,可大大增加采集难度。不过采集者执意要采集,也不是没有办法。只是需要花上大量的时间来整理采集规则。

  缺点:此方法实现有点难度。1.需要制作多个模板 2.需要修改程序来随机调用模板。

    分析 :这个方法并没有多少技术含量,关键在于模板的多少

    如果模板“足够多”甚至每篇文章都有单独的模板(这个想法早就有了,有空和大家交流下),可以真正达到反采集;

    如果模板只有几个,就没什么效果,采集者只要针对每个模板制作规则,每个规则各采集一次就可以达到目的。

  二、建立采集者IP库

  优点:此方法也比较简单,也比较实用。

  缺点:此方法属于亡羊补牢型,还需搜集采集者的IP地址。此方法也还有一个缺点:对动态IP采集者几乎无效。采集者有很多都是用火车头之类的采集软件来进行采集,再导入网站数据库的。而采集者大多都是动态IP或者在网吧进行采集。此方法虽然很被动,不过也不失为一种防采集的方法。

    分析:这个方法的重点在于怎么判断对方是采集还是普通的访问,如果能“快速”判断出采集者,将他的IP加到黑名单,效果还是不错的,就算他是动态IP,也要重新登陆宽带才可以换IP,换得太快太多说不定电信会找他麻烦呢!

  三、使用防采集控件

  优点:控件使用比较简单,也比较实用,而且完全免费,只需在原网页代码中加入几行代码就可对网页源代码进行防采集处理,很大程度上对采集起到干扰作用。

  缺点:需要注册控件,如果是虚拟空间则没办法使用。

  分析:这里的控件是指“鱼羊防采集控件”,这篇文章应该是控件作者写的软文,这个控件的原理和上面第一个方法的原理是基本一样的,就是想达到“每篇文章都有单独的模板”这样的效果,从而让采集者无法设置采认规则(一个规则只能采集一篇文章,还不如手动copy呢,呵呵)。

    不过,我分析了控件的示例文件后发现,这个控件很不成熟,经过处理后的文件看起来很乱,可懂程序的人很容易就能将之恢复到处理前的样子,出个破解控件就可以废了它,但在破解控件出来前对付菜鸟还是很有效的。

    这个控件其实没必要做成组件,在服务器上装组件太麻烦了,不是每个人都有服务器的,不知作者怎么想,也许是想以后卖钱吧

  • 相关文章:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表

Powered By Z-Blog 1.8 Devo Build 80201

Copyright 2008 站长之家 Some Rights Reserved. 浙ICP备06030779号