欧洲五大联赛球员比赛数据与赛事分析数据集2014-2015-2024-2025赛季-codytipton
数据来源:互联网公开数据
标签:足球,五大联赛,球员,比赛数据,xG,进球,射门,助攻,赛事分析,时间序列
数据概述:
本数据集涵盖了2014/2015赛季至2024/2025赛季(数据仍在更新中)欧洲五大联赛(英超、西甲、德甲、意甲、法甲)的球员比赛数据和赛事分析数据,数据来源于Understat网站的抓取。数据集包含球员的详细比赛表现,以及球队和比赛的综合信息。该数据集提供了比现有数据集更细致的球员每场比赛数据,例如预期进球(xG)、构建xG、进球数、射门数等关键指标。此外,还包含了比赛事件、球队赛季数据等。
数据包含以下几个主要表格:
-
球员比赛数据(lineup_stats):
- match_id:比赛ID
- goals:进球数
- own_goals:乌龙球数
- shots:射门次数
- xG:预期进球数
- time:球员出场时间
- player_id:球员ID
- team_id:球员所属球队ID
- position:球员场上位置(SUB表示替补出场)
- player:球员姓名
- h_a:主客场标识('h'为主场,'a'为客场)
- yellow_card:黄牌数
- red_card:红牌数
- key_passes:关键传球次数
- assists:助攻次数
- xA:预期助攻数
- xGChain:球员参与的每次控球的预期进球总和
- xGBuildup:球员参与的每次控球(不含关键传球和射门)的预期进球总和
- positionOrder:球员在首发阵容中的顺序
-
比赛综合数据(general_game_stats):
- id:比赛ID
- h_id:主队ID
- a_id:客队ID
- date:比赛日期
- league_id:联赛ID
- season:赛季
- h_goals:主队进球数
- a_goals:客队进球数
- team_h:主队名称
- team_a:客队名称
- h_xg:主队预期进球数
- a_xg:客队预期进球数
- h_w:主队胜率
- h_d:主队平局概率
- h_l:主队负率
- league:联赛名称
- h_shot:主队射门次数
- a_shot:客队射门次数
- h_shotOnTarget:主队射正次数
- a_shotOnTarget:客队射正次数
- h_deep:主队在禁区内完成的传球次数(不包括传中)
- a_deep:客队在禁区内完成的传球次数(不包括传中)
- h_ppda:主队在对方半场平均每次防守行动允许的传球次数
- a_ppda:客队在对方半场平均每次防守行动允许的传球次数
-
比赛事件数据(game_events):
- id:事件ID
- minute:事件发生时间(分钟)
- result:事件结果(例如:射门被封堵,射门被扑出等)
- X:射门发生时的X坐标
- Y:射门发生时的Y坐标
- xG:射门的预期进球数
- player:球员姓名
- h_a:主客场标识
- player_id:球员ID
- situation:射门发生的情景(例如:直接任意球,定位球,运动战等)
- season:赛季
- shotType:射门类型(例如:左脚,右脚,头球等)
- match_id:比赛ID
- h_team:主队名称
- a_team:客队名称
- h_goals:比赛进行时的(主队)进球数
- a_goals:比赛进行时的(客队)进球数
- date:比赛日期
- player_assisted:助攻球员姓名
- lastAction:射门前的最后一次行动
-
俱乐部赛季数据(clubs):
- club_id:俱乐部ID
- club:俱乐部名称
- league_id:联赛ID
- league:联赛名称
- season:赛季
- wins:胜场数
- draws:平局数
- losses:负场数
- pts:赛季积分
- avg_xG:赛季平均预期进球数
- total_goals:赛季总进球数
- total_goals_cond:赛季总失球数
数据用途概述:
该数据集可用于多种数据科学和分析项目,包括:
- 球员表现评估: 通过xG、进球数、射门数等指标评估球员的整体表现和效率。
- 比赛结果预测: 基于历史数据,分析球队的进攻和防守表现,预测比赛结果。
- 战术分析: 研究不同战术对比赛结果的影响,例如,高位逼抢对控球率的影响。
- 联赛趋势分析: 分析五大联赛的整体趋势,包括进球数、射门次数、xG的变化等。
- 数据科学训练: 为数据科学训练营项目提供实战数据,帮助学习者掌握数据清洗、分析和可视化技能。
- 俱乐部运营决策: 帮助俱乐部更好地评估球员,优化球队阵容,提升俱乐部运营水平。