数据集概述
本数据集包含美国境内商业航班的详细运营记录,涵盖2021年1月至2024年12月期间超过2400万条航班记录。数据来源于美国交通部交通统计局(Bureau of Transportation Statistics, U.S. Department of Transportation),记录了各航空公司在美国境内的计划与实际飞行情况,包括起降时间、延误信息、航班取消及改航等关键运营指标。
数据内容
数据集由两个主要文件组成,共包含约2430万条航班记录:
第一部分记录涵盖2024年全年数据,包含约708万条航班记录,涉及15家航空公司、348个起降机场。
第二部分记录涵盖2021年1月至2023年8月数据,包含约1727万条航班记录,涉及17家航空公司、375个机场。
数据集整体取消率约为1.4%至2.1%,改航率约为0.25%。
字段定义
数据集包含以下核心字段类别:
航班基本信息:航班日期、航空公司代码、航班号、起降机场代码及城市名称、起降州名
时间相关字段:计划起飞时间、实际起飞时间、计划到达时间、实际到达时间、滑行时间、起降轮接触地面时间、空中飞行时间、总飞行耗时
延误相关字段:起飞延误时长、到达延误时长、承运人原因延误、天气原因延误、空管系统原因延误、安全检查原因延误、前序航班延误
运营状态字段:航班取消标识、取消原因代码、改航标识
航程信息:飞行距离、计划飞行时长
数据特征
航空公司分布:西南航空占比最高,约占总航班量的19%至20%,其次为达美航空约13%至14%、美国航空约13%
机场覆盖:数据涵盖全美348至375个机场,覆盖主要枢纽及支线机场
时间跨度:2021年至2024年,其中2021至2023年数据为连续记录,2024年数据为完整年度记录
延误情况:平均起飞延误约12至13分钟,平均到达延误约6至7分钟。延误原因中承运人因素和前序航班延误占主要比例
数据完整性:核心运营字段缺失率低于2%,延误原因细分字段在非延误航班中存在约80%的缺失(符合数据逻辑)
适用场景
本数据集适用于以下分析与应用场景:
航空运营效率分析:评估各航空公司准点率、延误模式及运营表现
机场运营研究:分析机场容量、拥堵情况及地面运行效率
航线网络规划:研究航线分布、航班频次及市场覆盖
延误成因分析:识别延误主要原因及其对运营的影响
旅客出行规律研究:分析季节性、周期性出行模式
预测建模:基于历史数据构建航班延误预测模型
行业监管与政策研究:支持航空业监管决策及政策评估
数据来源
美国交通部交通统计局