美国航班延误与取消历史数据集USFlightDelayandCancellationHistoricalData-annielytics
数据来源:互联网公开数据
标签:航班延误, 航班取消, 航空运输, 交通运输, 时间序列分析, 机器学习, 数据挖掘, 航空公司
数据概述:
该数据集包含来自美国交通运输统计局(BTS)的航班数据,记录了2008年美国境内航班的详细信息,包括航班起降时间、延误时长、取消原因等。主要特征如下:
时间跨度:数据涵盖2008年全年。
地理范围:数据覆盖美国境内所有主要机场之间的航班。
数据维度:数据集包含多个关键字段,如:YEAR(年份),MONTH(月份),DAY_OF_MONTH(日),DAY_OF_WEEK(星期),FL_DATE(航班日期),UNIQUE_CARRIER(承运人代码),TAIL_NUM(飞机尾号),FL_NUM(航班号),ORIGIN_AIRPORT_ID(始发机场ID),ORIGIN(始发机场代码),ORIGIN_STATE_ABR(始发州代码),DEST_AIRPORT_ID(目的机场ID),DEST(目的机场代码),DEST_STATE_ABR(目的州代码),CRS_DEP_TIME(计划起飞时间),DEP_TIME(实际起飞时间),DEP_DELAY(起飞延误时间),DEP_DELAY_NEW(新版起飞延误时间),DEP_DEL15(起飞延误超过15分钟的标识),DEP_DELAY_GROUP(起飞延误分组),TAXI_OUT(滑出时间),WHEELS_OFF(起飞时间),WHEELS_ON(着陆时间),TAXI_IN(滑入时间),CRS_ARR_TIME(计划到达时间),ARR_TIME(实际到达时间),ARR_DELAY(到达延误时间),ARR_DELAY_NEW(新版到达延误时间),ARR_DEL15(到达延误超过15分钟的标识),ARR_DELAY_GROUP(到达延误分组),CANCELLED(是否取消),CANCELLATION_CODE(取消原因代码),DIVERTED(是否备降),CRS_ELAPSED_TIME(计划飞行时间),ACTUAL_ELAPSED_TIME(实际飞行时间),AIR_TIME(飞行时间),FLIGHTS(航班数量),DISTANCE(飞行距离),DISTANCE_GROUP(距离分组),CARRIER_DELAY(航空公司造成的延误),WEATHER_DELAY(天气造成的延误),NAS_DELAY(国家空域系统造成的延误),SECURITY_DELAY(安保造成的延误),LATE_AIRCRAFT_DELAY(晚到飞机造成的延误)。
数据格式:CSV格式,每月一个文件,文件名格式为airOTYYYYMM.csv,便于进行时间序列分析和数据处理。
来源信息:数据来源于美国交通运输统计局(BTS)的公开数据,经过标准化处理。
该数据集适合用于航空运输领域的研究和数据建模、机器学习等技术应用。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于航空运输、交通运输、运营管理等领域的学术研究,如航班延误原因分析、航空公司运营效率评估、机场容量规划等。
行业应用:可以为航空公司、机场、航空管理部门提供数据支持,特别是在航班时刻表优化、旅客服务改进、风险管理和运营成本控制等方面。
决策支持:支持行业内的决策制定,例如优化航班调度,预测航班延误,提升乘客满意度。
教育和培训:作为交通运输、数据分析等课程的辅助材料,帮助学生和研究人员深入理解航空运输的运作机制和数据特征。
此数据集特别适合用于探索航班延误与取消的影响因素、规律与趋势,帮助用户实现航班延误预测、运营效率提升等目标。