随着搜索引擎市场占有率的不断提升,在互联网中,使用搜索引擎的用户也越来越多。只要操纵搜索引擎的搜索结果就能够为网站带来流量,带来收益。那么作弊动机就会始终存在,尤其是在网络营销起着越来越重要宣传作用时代的今天尤其如此。作弊与反作弊是相互抑制同时也是相互促进的一个互动过程。今天我们就走进搜索引擎是如何利用其技术手段来进行反作弊的。
搜索引擎事实上以纯粹的技术手段是无法彻底的解决作弊问题的,必须将人工手段和技术手段相结合,才能取得较好的作弊效果。技术手段可以分为相对通用的手段和比较特殊的手段,相对通用的手段对于可能新出现的作弊手法有一定的预防能力,但是因为其能用性,所以针对性不强,对特殊的作弊方法效果未必好用。而专用的反作弊方法往往是事后诸葛亮,即只有作弊行为已经发生并且比较严重,才可能归纳作弊特征,采取事后过滤的方法。人工手段则与技术手段有很强的互补性,可以在新的作弊方式一出现就被人发现,可以看做一种处于作弊进行时的预防措施。所以从时间维度考虑对作弊方法的抑制来说,通用反作弊方法重在预防,人工手段重在发现,而专用反作弊方法重在事后处理,其有内在的联系和互补关系存在。
通用的反作弊方法大体有两类,一种类似于BadRank的思路,即从黑名单出发根据链接关系探寻哪些是有问题的网页;另一种类似于TrustRank的思路,即从白名单出发根据链接关系排除掉那些没有问题的网页。两者显然有互初的关系,通过两者搭配可以形成有效的反作弊屏障。这种通用方法的好处是具有预防性,哪怕是新出现的作弊方式,只要作弊网页需要通过链接关系进行操纵,那么通用方法就能在一定程度上起到作用。但是正是因为通用方法的通用性,所以其反作弊思路没有针对性,对于一些特殊的作弊手段无法有效的发现。此时,针对特殊作弊手段的方法形成了三道屏障,即搜索引擎公司针对具体作弊方法采取专用技术手段来进行识别,因为有针对性所以效果较好,但是缺点在于一类反作弊方法只能识别专门的作弊手段,对于新出现的作弊方法往往是无能为力的。就比如绿萝算法,就是针对型的技术。他针对的就是买卖链接的网站。而且在时间上往往滞后后作弊现象。也就是说,已经有了这项作弊手法,之后才针对这项作弊方法而推出的反作弊手法。
反作弊方法是有互补关系存在的,有效整合了三种手段,才能够获得较好的反作弊效果。