2017 即将结束, FIFA 18 也早已发行. 我们可以来浏览一下 FIFA 18 的数据, 看看那些"最好"的俱乐部.
数据加载和预处理
首先从文末的链接下载 fifa 18 的数据文件, 然后加载:
import numpy as np |
欧元文本类型转换
由于球员的身价和薪资数值是 string 类型, 比如 €5K
, 所以文本的欧元需要转换为 number 类型:
def extract_value_from(value): |
预处理完成后, 就可以进行一些聚合分析了.
顶级球员最多的俱乐部
这里以 >= 85 分
作为顶级球员的定义, 来查询顶级球员最多的俱乐部.
cutoff = 85 |
球员总身价排名
value_groupby_club = fifa.groupby('Club')[["Value"]].sum().sort_values(['Value'], ascending=[False]).head(20) |
球员总薪资排名
fig = plt.figure(figsize=(8,6)) |
位置分类
将 Preferred Positions
中的位置进行一个大分类 (前中后):
positions = ['GK','CB','LCB','RCB','LB','RB','CM','LDM','RDM','CDM','CAM','LM','RM','ST','CF','LW','RW'] |
把位置分好类之后, 就可以进行聚合分析了.
拥有中场球员价值
cm_groupby_club = fifa[(fifa['isMiddle']==True)] \ |
可以看到我大曼城排在第四.
对比平均身价
N = 3 |
如图, 曼城的平均身价还是挺高的, 作为英超传控球队, 多储备优秀的中场球员有利于球队的发展.
拥有前锋球员价值
st_groupby_club = fifa[(fifa['isForward']==True)].groupby('Club')[["Value"]].sum().sort_values(['Value'], ascending=[False]).head(20) |
可以看到大巴黎夺冠, 这得感谢第二位巴萨的内马尔转会.
增加薪资水平对比
N = 3 |
多特前场的薪资真低...
拥有后卫球员价值
back_groupby_club = fifa[(fifa['isBackward']==True)] \ |
最后
这里只进行了一些简单的俱乐部分析, fifa 18 的数据还有许多待挖掘的地方,
比如潜力值/年龄/国度/更细的能力指标等, 有待大家去作出更多更好的可视化分析出来.
(以上数据都是基于 fifa 18 的数据, 和现实有一些差距的.)