搜索引擎与作弊网站技术大战(1)
搜索引擎背后隐含着很大的经济利益,更容易被搜索到是提高点击率的一个重要途径,也是互联网“注意力经济”的一个重要指标,搜索引擎与作弊网站之间的矛盾,不光是技术上的攻防游戏,实际上是一个严肃的产业问题. “芙蓉姐姐”成作弊工具 打开Google,选关键词“芙蓉姐姐”点击,再任选一个“芙蓉姐姐”出现较多的一篇点击,接着出现两种可能:第一,只数秒钟,页面便突然弹跳到“亚洲在线最大的宽频影院”等等网页。第二,出现无数的“芙蓉姐姐”,再任意选择一个“芙蓉姐姐”点击,出现与第一种可能一样的页面——其内容与“芙蓉姐姐”丝毫无关,扑入眼里的是女人半裸的身体或半裸的乳房。 这便是一次完整的“作弊网站”体验。 几乎没有一次例外,当网络上有某一个词成为热点时,它必将成为作弊网站(亦被搜索引擎称为“垃圾网站”)最为热门的“作弊工具”。这一次轮到“芙蓉姐姐”。 在互联网搜索引擎领域,作弊网页已达到泛滥成灾的地步。 这是据芙蓉姐姐走红的7月12日的统计。以“芙蓉姐姐”为关键词,通过Google进行查询,约有1,030,000个相关网页。查看前40篇的网页,约有15条比较符合“芙蓉姐姐”的内容,占37.5%,有25条不符合“芙蓉姐姐”的内容,占62.5%。 除了最近两天刚排到第一位的门户网站新浪外,第二位是Mblogger,第三的是dyo.zj.com,均名不见经传。以排在前10位的来分析,除新浪外,几乎全是在BSP(Blog Service Provider托管服务提供商)上申请的BLOG网站(中文称“博客网站”),而在搜索结果的摘要内容上,这些网页类似于专题的形式,满目都是“芙蓉姐姐”,任意点开其中一个,大多弹出的是性感电影手机注册下载或铃声下载等页面。 在百度里,以“芙蓉姐姐”为关键词,找到相关网页约1,340,000篇,在前40篇中,排在前面的主要是网易、TOM、新浪女性、QQ等门户网站的专题,而在Google中,这些内容均被作弊的blog挤出前40篇之外。 据一位不愿透露名字的反spam(垃圾网站)专家王某介绍,百度这种搜索结果,并非百度偏好门户专题新闻类内容,根本原因在于,百度已将上文提到的Google前40篇内大部分的作弊网页自动删除掉了,结果比较符合“芙蓉姐姐”的网页内容自然在搜索中排得靠前了。 以“芙蓉姐姐”为关键词对照百度和Google两个主要搜索引擎的搜索结果,可以感受到百度搜索的用户体验要比Google好,因为在Google中查找意味着需要在一堆“垃圾”中寻找有效的网页。 作弊联盟 有意思的是,百度屏蔽这些垃圾网站时,遭到了这些网站在技术层面上的攻击。 “百 度一下”关键词“反百度联盟”会发现,在百度网站上有无数条有关“反百度联盟”的信息。自6月1日“反百度联盟”网站上线以来,目前已有2000多人次签名。 该网站上线之初,气势较大,但最近几乎没有了动静。 “反百度联盟”发起人为一个网名为“踏雪无痕”的网友,据称,其“美人鱼”个人文学网站于去年底被删除。该联盟在宣言中表示,该联盟是为了反对百度公司对广大站长和网友不公正而成立的同盟组织,本同盟成立的目的是“为了收集百度公司对待站长和网友不公正的证据,促进监督百度公司走向公正”。但是,该联盟成立一个半月以来,至今没有发现该联盟握有多少百度“对待站长和网友不公正的证据”。 而百度对待“反百度联盟”的态度是“兼容”,直接通过“百 度一下”,即可获得该联盟的所有信息。但据称,百度对此联盟相当重视,从该网站一出现,便组织专业人员对联盟成员及联盟成立原因进行调查,最终得出结论,从已明示网站站名的该联盟成员来看,被百度屏蔽的网站无一例外都曾违反了百度的搜索引擎反垃圾网页规则。 业内专业人士认为,成立反百度联盟是一件不正常的事情,这就像成立“假冒伪劣俱乐部”或“垃圾邮件联盟”一样,是不为一个社会所容的。 目前,搜索引擎领域的垃圾网站,已到了泛滥成灾的地步。其发展趋势完全等同于当年垃圾邮件,已像蝗灾一样,不仅危害搜索引擎,也直接危害互联网。 据百度PM总监俞军介绍,与作弊网站的斗争,将是互联网上一个长久的过程,目前双方的博弈与全球反病毒在技术与形式方面已没有什么区别。 俞军认为,从某种角度来说,几乎是垃圾网站在推动着搜索引擎的进步。 在搜索引擎发展初期,搜索引擎的专业人员一直在思考,如何让搜索者以最快速度搜索到最有价值、最为相关的结果,因而发明了meta tag——这是一种“超文本标志语言”,在互联网体系中的作用是表明该网页或网站的属性。 起初,meta tag是很好用的。那时候,诚实的web站点管理员(webmaster)们如实地填写网站摘要,如实地列出跟他的网站最相关的关键字,搜索引擎们抓取、索引、检索这些诚实的meta tag,并作为搜索结果排序的重要依据。为了有效提高搜索结果,有专门的网络人员研究SEO(搜索引擎优化),专门为网站提高搜索结果而进行优化。 然而,人们越来越发现,搜索结果的排序,是一个巨大的利益空间——如果谁的网站或网面能够排在搜索结果的前列,谁就有可能获得最大的“广而告之”效益而产生巨大利益。因而,许多“觉醒”过来的网站为了追逐这一利益空间而开始追求页面浏览量(pageview)——打开一个页面,却可包含数个页面元素,从而获得众多的点击数(Hits)——点击数则是“注意力经济”的一个重要指标。 而到了这个地步,一度推动技术进步的“搜索引擎优化”(SEO)已异化成“搜索引擎作弊工具”(英文简称“SEO SPAM”)。 从Google的“芙蓉姐姐”的搜索结果便可看到这一典型的作弊:在meta tag中塞进成堆的关键字,或塞进跟自己的网站内容无关,但是非常流行的关键字——但当你打开它时,它又迅速地跳转入作弊网站设定的网页页面中。
首页 上页 | 1 | 2 | 下页 尾页 共 2 页