据国外媒体报道,谷歌通过一系列实验证明,微软通过IE浏览器、必应工具栏等手段监测用户的谷歌搜索行为,并借用这些信息改进必应搜索结果。谷歌将这称为一种“作弊”行为,而微软并没有对此予以否认。
通过这些措施,必应的搜索结果与谷歌更为接近。谷歌称,这种行为就像是在考试的时候作弊抄袭一样。谷歌搜索引擎排名算法负责人艾米特·辛格哈尔(Amit Singhal)表示:“我的整个工作就是打造优秀的搜索引擎。我欢迎竞争对手开发创新的搜索算法,但抄袭并不是创新。”
必应也没有否认谷歌的指责。微软必应搜索引擎主管史泰芬·韦茨(Stefan Weitz)通过电子邮件发布声明称:“正如你所想象,我们通过不同的因素和方法进行排名,但与其它搜索引擎一样,我们不能深入详细地介绍排名方法。显然,最重要的目标就是更好地确定搜索意图,以便我们对搜索请求做出最准确的猜测,提供最关联的答案。”
韦茨表示:“必应工具栏有助于我们获取数据,这是我们及其它搜索引擎用来进行网站排名的因素之一。谷歌进行的实验就像是对这些排名因素的混淆和操纵。”
谷歌的怀疑
去年5月底,谷歌注意到,在用户输入拼写错误的情况下,必应搜索结果与谷歌搜索结果显示的网站惊人地相似。例如,用户输入“torsoraphy”进行搜索。谷歌会将用户的拼写更正为“tarsorrhaphy”,进而提供大量的搜索结果,其中排名最靠前的是维基百科对于这个医学术语词条的解释。而通过必应搜索“torsoraphy”会发现,必应并没有提出拼写更正建议,而且搜索结果仅有4条,但排名最靠前的同样是维基百科对“tarsorrhaphy”这个词条的解释。
谷歌一直自豪地认为,谷歌的拼写纠正系统是所有搜索引擎当中最出色的,谷歌甚至声称它能够纠正从未输入搜索的错误拼写。谷歌负责拼写纠错的工程师会密切关注,确定自己是否在不常见词条的搜索中击败竞争对手。因此,一旦必应在错误拼写词条的搜索中提供了与谷歌相同的搜索结果,谷歌工程师立即警惕起来。
2010年10月,谷歌注意到与必应在两项竞争指标方面越来越接近。在一系列搜索中,必应都与谷歌搜索结果前十位的链接有了比之前几个月更大范围的重合。另外,谷歌和必应将同一个页面列为搜索结果首位的情形越来越多。
必应与谷歌的搜索结果不可能完全相同,而且很多搜索请求的结果有很大区别。然而,这两项指标的增加表明必应对其搜索算法做出了一些改变,使其搜索结果更加接近于谷歌。
谷歌更加怀疑必应抄袭自己的搜索结果,尤其是关注用户对谷歌搜索的使用,因为没有别的方法可以使必应搜索结果如此接近于谷歌,尤其是在拼写错误的情况下。
谷歌认为,微软IE浏览器在这其中发挥了作用。或许IE浏览器可以将用户的搜索数据发送给必应,尤其是IE浏览器的“推荐网站”功能和必应工具栏。
实验论证
为了证实自己的怀疑,谷歌启动了一系列实验。谷歌有史以来首次撰写了一些一次性代码,允许对部分特定的词条手工排列搜索结果页面。之后,谷歌编写了100余词条,并称之为“人造搜索”。
最初,这些词条在谷歌和必应上都没有搜索结果,或者只有少数非常不相关的搜索结果。之后谷歌启动了代码,将一些实验页面放置在“人造搜索”的结果页面当中。
这些页面出现在谷歌搜索结果当中的唯一原因就是谷歌强迫其出现,但它与搜索词条没有任何关联。如果必应搜索也出现同样的结果,那么说明必应确实抄袭谷歌搜索结果。
2010年12月17日,大约20名谷歌工程师按照要求,在家中通过笔记本电脑上网搜索,使用的是IE浏览器,同时启动了“推荐网站”和必应工具栏。他们输入人造词条进行搜索,并点击搜索结果排名靠前的页面。到12月31日,必应搜索出现了同样的搜索结果。
例如人造词条“hiybbprqag”最初在谷歌和必应都没有任何搜索结果。但谷歌开始实验之后,手工添加了搜索结果,以便特定的页面能够出现在搜索页面当中。两周之后,必应搜索“hiybbprqag”也出现了同样的搜索结果。
谷歌表示,并非所有的人造词条都在谷歌和必应出现了同样的结果,100条中大约有7到8条出现了这种情况,但这已经足以证明必应借助IE浏览器抄袭谷歌搜索结果。
通常搜索引擎都会根据不同的因素进行搜索算法,以决定哪些页面排名靠前。谷歌和必应也有一些相同的搜索算法因素,包括页面包括的文字、指向该页面的链接数量、这些链接的重要性等。
谷歌的实验表明,当必应通过上述传统的因素可以确定搜索结果时(例如常用话题搜索),那么必应将主要采用这些因素进行排名。但在必应找不到太多可信任的排名因素时,它就会学习谷歌的搜索排名。
微软的工具
IE浏览器在默认设置下,将抓取用户的浏览数据,除非用户关闭部分功能。IE浏览器的“推荐网站”功能则有可能是必应的另外一个工具,它可以通过用户的浏览记录向用户推荐一些网站。而微软也已经证实,这一功能确实会收集部分用户浏览网站的数据。此外,如果用户安装了必应工具栏,那么它的默认设置将抓取用户信息,以改进用户体验。
当然,谷歌也有自己的谷歌工具栏和Chrome浏览器。不过谷歌表示,从未借助这些工具监视用户的必应搜索行为。艾米特·辛格哈尔表示:“谷歌搜索排名可以将URL发送回来,但我们从未将这些URL或数据用于谷歌搜索结果。我们从未这样做过,以后也不会这样做。”
不过谷歌工具栏也在搜索结果排名中起了一定作用,因为它可以确定网站的加载速度,而加载速度正是谷歌搜索排名的考虑因素之一。另外谷歌表示,Chrome浏览器发回的信息并不会用于改进搜索结果。谷歌强调说,只有用户通过Chrome浏览器进行谷歌搜索的信息,才会被传送回谷歌。
谷歌的困扰
目前困扰谷歌的问题是抄袭搜索结果的做法是否违法。辛格哈尔表示,目前还比较犹豫,因为尽管必应模仿谷歌的搜索结果,但谷歌并未失去什么,谷歌的搜索结果依然存在。
有人认为,微软这种做法是一种明智的表现,因为它将谷歌搜索排名靠前的网页纳入搜索结果考虑因素范围。但谷歌认为,这并非明智,而是作弊。
辛格哈尔表示:“在我看来,这是作弊行为,因为我们努力工作多年才取得这样的成绩,但他们盗取我们的努力成果。我不知道如何形容这种做法,简单而言就是作弊。做一个比喻就是在马拉松比赛中,其中一名参赛选手趴在别人背上完成前面的比赛,快到终点时下来冲刺。”
|