散点图这一形式自推出以来,总体上得到了大家的好评和捧场,在这里先说一声谢谢!
今天我们继续这种形式,这篇文章的目标,是要通过禁区内触球数,来看看英超部分前场球员的触球区域分布,以及球员禁区内触球总数占全队的比重,来看看英超部分中前场球员的球场选择,以及球队对该球员禁区内活动能力的倚重程度。但遗憾的是,我目前只能找到英超方面的详细触球数据,所以本文只能针对英超,而无法覆盖到其他联赛。
平常和朋友们聊球,经常被问及“谁的球权多”这个问题。 对于这个问题,最直观的方法是在位置、角色相差不大的情况下,看触球数。实际上这个数据的应用非常广泛,大家平常在whoscored、squawka等提供基础数据的网站,以及各大中文足球平台复盘文章中看到的所谓“球员活动热区图”,其实就是“触球分布”,诸如“活动热区”、“覆盖区域”等说法,严格来说是错误的。
我们知道,球场上触球次数的多少,同控球率以及传球数直接相关。控球率越高,你在一场比赛中重复触球的次数就越多;传球越频繁,你刷到触球数的可能也就越大。英超每90分钟触球最多的前10名球员,几乎完全集中在利物浦、曼城和切尔西阵中。然而,如我们刚才所说,“触球”这个数据更多指向的是“球权”。我们显然不能说,A球员在曼城每90分钟触球80次,B球员在水晶宫每90分钟触球70次,A球员比B球员球权更多。因为A球员的高触球数,极有可能是在高频率的传递与超高控球率体系下刷出来的。比如下图:
因此,我们最好能够统计出一名球员在球队触球的占比,如果同样是中场,那么触球占比较大的中场,显然比占比小的中场球权多。如果是前锋,那么禁区内触球占全队禁区内总触球次数比重较大的前锋,就承担了更多的抢点重任。
同样的,具体到个人,我们不能说因为A比B禁区内触球多,所以A比B的活动区域更集中于禁区。因为A可能是因为触球总数多,所以才导致禁区内触球多。举个例子:大卫·席尔瓦每90分钟禁区内触球8.64次,瓦尔迪5.95次,我们能说席尔瓦比瓦尔迪更频繁在禁区内活动吗?显然不能。因此,合理的方法是统计某球员禁区内触球占总触球的比重,禁区内触球占比越高,越喜欢在禁区内活动。
1,看某球员禁区内触球占其个人总触球次数的比重,占比越大,说明此人越倾向于在禁区内讨生活;
2,看某球员禁区内触球的次数,占球队禁区内触球总次数的比重,占比越大,说明球队越仰仗此人在禁区内的活动能力。
这里面需要注意的是,第2点是存在误差的,因为各大数据公司很离奇的直到现在都还没有意识到,统计某球员在场时的球队数据有多么重要。A球员今天上了明天没上,或者上半场没打下半场打了,那么他没打的比赛中,就纯粹是团队数据增加而个人数据不变,这显然对统计其触球数据占全队比重极为不利。一些经常替补出场的前锋比如拉卡泽特,显然受此影响极大。这也是没办法的事,希望大家有兴趣的话对此算法作出修正。
横轴为球员个人禁区内触球占比,越靠右表示某球员的触球位置越集中于禁区,也就意味着该球员更喜欢禁区;
纵轴为某球员在禁区内触球的次数,占球队禁区内触球总次数的比重,越靠上表示禁区内触球占球队总数比重越大,也就意味着球队更仰仗该球员在禁区内活动;
圆点大小代表出场时间,颜色则表示每90分钟禁区内触球次数,颜色越深,每90分钟禁区内触球次数更多。
这二者之间又多少存在一些区别——瓦尔迪是既承担禁区内抢点重任,又作为莱斯特城反击箭头存在;而阿圭罗则是在全队传控能力惊人的前提下,自己不需要在禁区外多辅助中场传递,索性打出超高的禁区内触球占比。我们贴4张动图,看看两人各自极为典型的禁区内触球方式。首先是瓦尔迪的:
很显然,在莱斯特城这种较为侧重反击的打法下,瓦尔迪更多是作为箭头而非抢点者存在的,他不可能等着队友缓缓推进给他输送炮弹;同时也不需要回撤参与中场过渡——事实上,莱斯特城的这套打法,某种意义上根本就没有过渡。
两张动图中,阿圭罗都是在前面等着,而后曼城在相对慢节奏的传控推进中找到渗透机会,阿圭罗实际上是阵地战中的抢点者。
提供一个可能有些出人意料的数据:尽管阿圭罗显然是持球能力更强的前锋,但实际上本赛季两人满足一定距离的持球推进(progressive runs)相差并不大:瓦尔迪每90分钟1.3次,阿圭罗则是1.96次。
诺维奇和水晶宫这两个有些破门乏术的球队(进球数一个倒数第5,一个倒数第2),都很难在对手禁区内安排大量的抢点者,各自的进攻大腿普基与扎哈,成为了英超禁区内触球占球队比重最高的两名球员。二人动不动就是一串单干。当然其中也有所区别:普基很大程度上是孤立无援,比如这样:
当然,这二人能承担如此高的队内禁区内触球重任,也与其各自能力有关。普基在本赛季初打出惊人的射门准星,“真实射门得分率”一度位居英超前列(不明白这个概念的朋友可以参考三张高阶数据图告诉你:本赛季三大联赛,谁的射门有质又有量),现在即便回调也仍旧能够达到还算体面的2.30%。下图就是普基在反越位后禁区内得球射门得分。这球的预期进球数只有0.08:
利物浦这个队我们曾经多次说过,进攻端并不强调什么地面渗透,而是极为注重在禁区内堆砌人数。这导致他们禁区内触球总数很多。但问题是,由于克洛普会频繁授意前场某一名球员回撤或者套边接应,让中场插上抢点,因此前场三人组尽管各自禁区内触球占球队比重,都突破了20%,但马内与菲尔米诺各自的禁区内触球占比,却并不高。二人一个频繁拉边,一个动辄回撤。只有萨拉赫,算得上把个人习惯与球队需求兼顾了起来。当然,此人这赛季在这方面其实是进步了的:他每90分钟禁区内触球次数,从上赛季的5.7次,增加到了本赛季的6.25次。
萨拉赫的一大特点在于各项技术都相对比较成熟,持球能力极强,又兼具爆发力与良好的中锋做球习惯。结合利物浦前场灵活多变的站位,萨拉赫动不动能打出覆盖整个禁区的禁区内触球。我们把他在一场比赛中3次禁区内触球都粘贴下来,这是在三个完全不同的位置打出来的,左中右三者皆备,而且后续处理也都不一样:
而刚才我们放的扎哈的第二张图,那场比赛里,扎哈的禁区触球分布,是这样的:
曼联与热刺这两支本赛季一度令人非常失望的球队当中,禁区内触球占球队比重最高的球员,分别是拉什福德与孙兴慜。有趣的是,这两人都出现在了横轴的靠左区域,也就是说:他们自己的触球分布并不集中于禁区内。
但是,这一数据背后的道路却完全不同。孙兴慜本赛季成为热刺攻击线上的超级大腿,其实他自己各项持球技术的成功率并没有本质提高,然而球队前场其他人各种凉凉,逼得孙兴慜扛起超重球权。其实热刺不是禁区内持球靠孙兴慜撑数据,是整个前场几乎各个环节都靠他。看看孙兴慜实现禁区内触球的方式,那叫一个累:
而拉什福德的情况则完全不同:我们在上一篇文章图文深度解析:4大联赛哪支球队的传球最具挑战性中提到:曼联这赛季诡异的打出了超高的smart pass占比,这其中做出贡献最多的并不是哪个超级中场,而是拉什福德——索尔斯克亚不知出于何种考虑,设计了大量拉什福德撤到外围策应的打法,仿佛是要按照年轻时本泽马的路线改造拉什福德。可问题是,曼联其他球员插入禁区接应的效果并不怎么样,拉什福德自己的smart pass实际威胁也并不是特别大——曼联的smart pass成功率其实不高。
这种策应式的打法,导致拉什福德个人的触球分布并不集中于禁区内。比如这样:
那拉什福德为什么禁区内触球占全队的比重如此之高呢?原因很简单:首先,曼联全队禁区内触球次数就不多,同时分布又极为分散。本赛季曼联迄今为止每90分钟禁区内触球24.05次,排名英超第7,最多算得上中规中矩。而队内每90分钟禁区内触球超过5次的,就只有拉什福德与马夏尔,其他的都是一大票4次都不到的。
其次,拉什福德及受重用,其出场时间是曼联本赛季第3长的,仅次于场场打满的德赫亚与马奎尔。事实上马夏尔禁区内触球的频率要比拉什福德更高,但受出场时间限制,占全队总数的占比自然会偏低。这也是目前这个技术统计的最大局限,只能期待以后数据统计公司意识到这一点,尽早提供类似NBA的On/Off统计了。
目前从事足球数据统计的几个公司,其实并没有进行过彼此整合,他们对统计的界定是不同的。相对而言,Opta的标准会更加宽松,国内各大App,也都是购买Opta的数据,只不过大多购买的都是基础数据包而已。如果我们参考wyscout的触球数字,就会发现几乎所有人的触球数都会减少,这是因为界定方式不大一样。而本文参考的,主要是opta的数据。
当然,这丝毫不耽误我们用一个数据源,去对数据进行进一步处理。只不过因此导致的各种问题,包括没有类似“正负值”的统计所造成的困境,都需要我们去正视。还是那句话,足球数据分析,其实在任何国家都处于刚起步的阶段。现在纠结它是否存在问题,是否是万能的,其实完全是自己树靶子自己打。它当然存在问题,甚至会永远存在问题。重要的是,这是一个重要的方法论和看球视角。
存在漏洞的意义,就是欢迎大家尝试去填补这个漏洞,让它不断趋于完美。足球,或者说任何事物,不都是这么个发展轨迹么?