航班延误预测数据集-2021-2022

航班延误预测数据集-2021-2022 数据来源:互联网公开数据 标签:航班,延误,预测,交通运输,航空,时间序列,机器学习,数据分析 数据概述: 本数据集源自美国运输统计局(BTS),提供了1987年至今的航班数据,为预测航班延误问题提供了基础。BTS是美国交通部(DOT)下属部门,是关于商业航空、多式联运货运和运输经济学的权威统计来源,为政策制定者和公众提供了理解交通运输统计数据的背景信息。本数据集包含了2021年和2022年部分月份的航班信息,数据按月提供,每个月包含近五十万条航班信息。数据经过预处理,缺失值已通过删除处理。

数据文件包括: Predict_Filght_Delays_2021.csv:2021年所有航班信息,已处理缺失值。 Predict_Filght_Delays_2022_M1_M4.csv:2022年1月至4月的航班信息,已处理缺失值。 dataset.csv:2021年6月、9月、12月和2022年3月的航班信息,为训练模型而创建的精简数据集,已处理缺失值。 stream_data.csv:2022年4月的航班信息,用于模拟实时系统,已处理缺失值。 T_ONTIME_REPORTING_Y_X:包含X年Y月所有航班信息的原始数据文件。 Attribute Information.pdf:详细的属性信息说明。

数据用途概述: 该数据集主要用于航班延误预测模型的构建和分析。研究人员可以使用该数据进行时间序列分析,探索影响航班延误的各种因素,例如天气、航空公司、出发地、目的地、起飞时间等。数据可用于开发和评估机器学习模型,预测航班延误的可能性和时长,从而帮助航空公司优化运营、改善乘客体验,以及为机场管理提供决策支持。此外,该数据集也适合用于教学和科研,例如数据挖掘、统计分析等相关课程的实践。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1496.53 MiB
最后更新 2025年7月14日
创建于 2025年6月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。