正文内容 评论(0

欧洲杯16强排座次:西班牙究竟比意大利强多少?
2012-07-04 08:56:41   编辑:上方文Q     评论(0)点击可以复制本篇文章的标题和链接

欧洲杯已经结束,西班牙伤了无数球迷的心。在它还没过去的太久时,让我们再来回顾一下吧。

欧洲杯已经落幕,西班牙夺冠让无数巴神的球迷心碎。犹记得小组赛时,两队还是打平,谁能料想决赛竟成屠杀。如果欧洲杯冠军不是根据决赛一场定成败,而是根据两支队伍在整个欧洲杯期间参加过的所有比赛的表现来定,西班牙相比于意大利队还有多少优势?

另一方面,欧洲杯没有季军争夺战,你可曾好奇过,在半决赛中被淘汰的德国和葡萄牙,谁强谁弱?捷克、希腊、法国、英格兰都是在1/4决赛中被淘汰,但是这4支球队谁应该是第五名,谁应该是第八名?日本大学计算机系的两位教授就给出了一个专业的排名方案,不过他们分析的是上届世界杯,这里我们把模型拿来用到本届欧洲杯上。

欧洲杯16强排座次:西班牙究竟比意大利强多少?

如何比较两只并未交手的球队

首先看两支进入决赛的队伍,他们都进行过6场比赛:

西班牙6场比赛:

西班牙 1-1 意大利
西班牙 4-0 爱尔兰
西班牙 1-0 克罗地亚
西班牙 2-0 法国
西班牙 0-0 葡萄牙(点球4:2)
西班牙 4-0 意大利

意大利6场比赛:

意大利 1-1 西班牙
意大利 1-1 克罗地亚
意大利 2-0 爱尔兰
意大利 0-0 英格兰(点球4:2)
意大利 2-1 德国
意大利 0-4 西班牙

小组赛的时候西班牙和意大利在同一小组,最后西班牙小组第一,意大利是小组第二。在各自进行的6场比赛里,西班牙平了一场,意大利平了两场还输了一场。进球数和净胜球数方面,西班牙也占上风。据此这样简单地看,在这次欧洲杯上,西班牙的小组赛和淘汰战绩加一起还是好于意大利。

不欧洲杯这样的淘汰赛不同于各国联赛的循环赛制,球队不是两两都会相遇。按照胜一场得3分,平一场得1分以及净胜球的方式决定排行榜的位置并不公平。

举个例子,A组的一支队一胜两负淘汰出局,B组也有一支队伍也是一胜两负淘汰出局,对于这两个队,我们如何判断谁强谁弱?——这就要看A组和B组里其它球队在这次欧洲杯的表现了,如果A组的其它球队闯进四强或者决赛,这说明A组是死亡之组;如果B组其它球队表现比较差,出线后就立刻就被其它队淘汰,这说明B组整体实力平庸。很容易看到,在A组赢一场比赛的难度和在B组赢一场比赛的难度不一样,可以认为A组被淘汰的队伍表现要好于B组那支。

用特征向量来评分

也就是说,我们要保证与强队交手和与弱队交手区分对待。有一种最大特征向量的方法可以做到这一点:我们让一支球队在击败强队的时候获得的加分多,击败弱队的时候获得的加分少。比如某一支球队如果大比分赢过西班牙(或者至少输的比分少),在排名中就会获得更多加分,而即使它大胜爱尔兰,在排行榜中的加分也不会很多。这样尽管欧洲杯的16支球队每支队伍的对手不同,我们还是可以根据各个队最后得到的总分数得到一个大排名。

首先把16支队遍上好1-16号,计算出一个16×16的“得分”矩阵A,矩阵里第i行,第j列的元素为: 

欧洲杯16强排座次:西班牙究竟比意大利强多少?

rij代表比赛的两队对阵时占的优势各是多少。假设2号队是希腊,4号队是捷克,两队之间的比赛是捷克2:1希腊,当i=2、j=4的时候,Sij=1、Sji=2,最后算出来rij=0.4,反过来,rji就会是0.6(rij+rji=1)。在一场比赛中,一个队比分的优势越大,对应的r也就越大(0≤r≤1)。如果是平局r=0.5,当然,两队加一起一定是1。为了公平起见,点球大战出现的比赛可以把一个点球按照0.2或者0.4个球算。

对于那些没有交过手的球队,矩阵里对应的格子都设成是一个比较小的正数(比如0.15)。把所有进行过的比赛的结果的数值都填到矩阵里之后,矩阵A就会是这样:

欧洲杯16强排座次:西班牙究竟比意大利强多少?

接下来,Ax=Kx,x是一个长度为16的“特征向量”,分别代表着每支球队的“分量大小”,K为特征值,通过计算我们可以找到最大的特征值对应的特征向量。在最大特征向量里,一支球队对应的数值越大,代表着对手击败它可以捞到更多的加分,自然也意味着这个队在整个欧洲杯比赛中表现越好。

按照本届欧洲队各队比赛结果,就能算出各队的得分:

欧洲杯16强排座次:西班牙究竟比意大利强多少?
以特征向量里数值最大的西班牙做为标准值1

可以看得出,西班牙总的表现就是确实好过意大利。不仅如此,德国在半决赛里虽然输给意大利,但是如果包括了小组赛和1/4决赛,德国总体的表现也好过意大利队,甚至葡萄牙的分数都高过意大利。这个结果多少有点令人吃惊。

这个排名并不完美

其实这种排名规则也是Google网页搜索结果的排序的原理。Google排序的依据是网页之间互相链接的数量,而不是看网页被点击的数量。如果一个网页被很多本身就很热门的网页链接,它也会被放到搜索结果的前列(就像一支队如果在跟多支强队交手中表现都很好一样)。当你在搜索一个词汇的时候,网站强大的服务器会迅速计算出一个“得分”矩阵,标示着所有网页两两之间的链接强度,找出特征量,以此为依据列出网页热门程度的排名。

不过,这个球队排名并没有那么完美。在这里每一场比赛都被视为同样重要。事实上越往后的比赛越重要,这样的比赛更能反映出一支球队的水平。没有对小组赛和淘汰赛划分权重,是这个排名方法的最大不足之处。

 (文/果壳网)

【本文结束】如需转载请务必注明出处:快科技

责任编辑:

  • 支持打赏
  • 支持0

  • 反对

  • 打赏

文章价值打分

当前文章打分0 分,共有0人打分
  • 分享好友:
  • |
本文收录在
#王雪红#数据报告

  • 热门文章
  • 换一波

  • 好物推荐
  • 换一波

  • 关注我们

  • 微博

    微博:快科技官方

    快科技官方微博
  • 今日头条

    今日头条:快科技

    带来硬件软件、手机数码最快资讯!
  • 抖音

    抖音:kkjcn

    科技快讯、手机开箱、产品体验、应用推荐...