航班延误预测数据集FlightDelayPredictionDataset-crowarmbrust

航班延误预测数据集FlightDelayPredictionDataset-crowarmbrust

数据来源:互联网公开数据

标签:航班延误, 机器学习, 预测模型, 时间序列分析, 航空数据, 航班信息, 预测, 数据挖掘

数据概述: 该数据集包含来自航空公司的航班数据,记录了航班的各类属性及延误情况,用于预测航班是否会延误。主要特征如下: 时间跨度:数据未明确标明具体时间,但根据字段信息推测为某个时间段的航班数据。 地理范围:数据未明确标明地理范围,但包含了出发机场和历史数据,可能涵盖多个机场和航线。 数据维度:数据集包括多个关键字段,如航班月份(MONTH)、星期几(DAY_OF_WEEK)、出发时间段(DEP_BLOCK)、飞行距离组别(DISTANCE_GROUP)、航段号(SEGMENT_NUMBER)、同时段航班数(CONCURRENT_FLIGHTS)、座位数(NUMBER_OF_SEATS)、航空公司名称(CARRIER_NAME)、机场月度航班数(AIRPORT_FLIGHTS_MONTH)、航空公司月度航班数(AIRLINE_FLIGHTS_MONTH)、航空公司机场月度航班数(AIRLINE_AIRPORT_FLIGHTS_MONTH)、机场月平均乘客量(AVG_MONTHLY_PASS_AIRPORT)、航空公司月平均乘客量(AVG_MONTHLY_PASS_AIRLINE)、每乘客的乘务员数量(FLT_ATTENDANTS_PER_PASS)、每乘客的地勤服务数量(GROUND_SERV_PER_PASS)、飞机机龄(PLANE_AGE)、出发机场(DEPARTING_AIRPORT)、前序机场(PREVIOUS_AIRPORT)、降水量(PRCP)、降雪量(SNOW)、积雪深度(SNWD)、最高气温(TMAX)、平均风速(AWND)、航空公司历史数据(CARRIER_HISTORICAL)、出发机场历史数据(DEP_AIRPORT_HIST)、当天历史数据(DAY_HISTORICAL)、出发时间段历史数据(DEP_BLOCK_HIST)以及目标变量(LABEL),其中LABEL字段为0或1,表示航班是否延误。 数据格式:CSV格式,包含train.csv(训练集)、test.csv(测试集)和sample_submit.csv(提交样例)三个文件,方便数据分析和模型训练。 来源信息:数据来源于公开的航空数据,经过标准化处理,字段已进行数值化处理。该数据集适合用于航班延误预测研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于航空领域和时间序列分析的学术研究,如航班延误预测模型构建、影响因素分析等。 行业应用:为航空公司、机场等提供数据支持,可用于航班管理、运营优化、风险评估和预测等。 决策支持:支持航空公司制定更有效的航班调度策略,提高准点率,优化资源配置。 教育和培训:作为机器学习、数据挖掘和时间序列分析课程的实训数据,帮助学生和研究人员理解航班延误预测的流程。 此数据集特别适合用于探索影响航班延误的因素,构建预测模型,从而帮助用户优化航班安排、提高运营效率。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 34.95 MiB
最后更新 2025年5月19日
创建于 2025年5月19日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。