概述
本数据集包含2004年至2023年期间美国民用航空事故的详细统计记录,涵盖29,028起航空事故案例。数据源自美国国家运输安全委员会(NTSB),为航空安全研究、事故分析和风险评估提供全面的基础数据。
数据结构
数据集包含23个字段,记录了每起航空事故的基本信息、地理位置、伤亡情况、航空器信息和事故特征等关键要素。总数据量为5.6MB,整体数据完整性良好,平均缺失率为14.18%。
字段定义
- NTSB Number:事故编号,NTSB官方唯一标识符
- Accident Report:报告类型,标识事故调查报告状态
- Event Date:事故发生日期,格式为年月日
- City:事故发生城市
- State or Region:事故发生州或地区
- Country:事故发生国家
- Latitude/Longitude:事故发生地理坐标
- Fatal Injuries:死亡人数
- Serious Injuries:重伤人数
- Highest Injury Level:最高伤害等级分类
- Aircraft Number:涉事航空器数量
- Damage Level:航空器损坏程度
- Registration Number:航空器注册号
- Aircraft Category:航空器类别
- Aircraft Make:航空器制造商
- Aircraft Model:航空器型号
- Flight Regulation:适用飞行法规
- Flight Schedule Type:航班计划类型
- Purpose of Flight:飞行目的
- Intentional Act:是否为故意行为
- Defining Event:定义性事件类型
- Phase of Flight:事故发生飞行阶段
数据特征
- 时间跨度:2004年1月1日至2023年12月31日,覆盖近20年
- 地理范围:主要集中在美国,涵盖92个国家和地区
- 事故类型:包含各类民用航空事故,从轻微损坏到完全毁坏
- 航空器类型:涵盖飞机、直升机等多种民用航空器
- 伤亡记录:详细记录死亡和重伤人数统计
数据质量
- 大部分核心字段完整性较高,如事故编号、日期、地点等缺失率低于2%
- 部分字段缺失率较高,如航班计划类型(92.4%)和故意行为(99.8%)
- 地理坐标数据基本完整,支持空间分析应用
适用场景
- 航空安全趋势分析和事故模式识别
- 航空器制造商和型号安全性能评估
- 地理空间分布分析和高风险区域识别
- 航空监管政策效果评估和改进建议
- 保险精算和风险评估模型建立
- 航空安全培训和教育材料开发