美国国家橄榄球联盟年度联赛数据集-1960至2021年-chancev
数据来源:互联网公开数据
标签:NFL,橄榄球,联赛数据,体育,球队表现,胜负记录,统计分析,预测建模,数据清洗,特征工程
数据概述:
本数据集包含1960年至2021年间美国国家橄榄球联盟(NFL)各年度的联赛数据,涵盖了各支球队的赛季表现。数据集来源于每年NFL官网的联赛排名页面,并通过Web Scraping技术收集整理。数据文件包括各年度独立的联赛数据文件以及一个综合文件,方便分析和比较不同年份的数据。数据集的字段描述位于文档底部。
数据用途概述:
该数据集适用于体育数据分析、球队表现研究、胜负预测建模等多种场景。研究人员可以利用此数据进行球队历史表现分析、胜负预测建模、特征工程练习等。具体应用包括:
- 更改PCT列名称,使其反映所计算的统计百分比。
- 特征工程建议:
- 从'record'列(Home, Road, Division)中提取信息,创建新的统计列。
- 创建'Undefeated'列,标记球队在每个记录列中是否保持不败。
- 提取连胜和连败信息,创建'Win Streak '和'Lose Streak '列。
- 添加新列指示球队所在的分区。
- 使用数据回答以下问题:
- 最近二十年中,表现最好的球队和最差的球队分别是谁?
- 哪些球队主场表现更好,哪些球队客场表现更好?
- 哪些球队平局最多?
- 选择你最喜欢的一支球队,分析他们最佳的赛季表现,是否有过不败记录?
字段信息:
NFL Team:球队名称(包括主场城市)
W:总胜场数
L:总负场数
T:总平局数
PCT:胜场百分比
PF:球队总得分
PA:对方总得分
Net Pts:净得分
Home:主场战绩
Road:客场战绩
Div:分区战绩
Pct:分区胜场百分比
Conf:联盟战绩
Pct.1:联盟胜场百分比
Non-conf:非联盟战绩
Strk:连胜或连败
Last 5:最近五场比赛战绩
Year:统计年份