1933至2009年大型客机空难事故数据集-juancarlosventosa
数据来源:互联网公开数据
标签:空难,客机,航空安全,事故历史,生存率,航空事故,飞行安全,数据科学,公共安全
数据概述:
本数据集包含1933年至2009年间发生的456起大型客机空难事故信息。数据源自Kaggle上Sauro Grandi提供的Airplane_Crashes_and_Fatalities_Since_1908.csv数据集。在此版本中,从原始数据集中提取了大型客机空难事故,并依据每起空难的生存者与总人数之比,将其标记为“高死亡率”或“低死亡率”空难。标签通过K-means聚类算法确定(见《Surviving Air Disasters: Cluster Analysis》)。
数据字段包含:
- 日期:事故发生日期
- 时间:事故发生地的当地时间,采用24小时制,格式为hh:mm
- 地点:事故发生的地点
- 运营方:航空公司的名称或飞机运营商
- 航班号:飞机运营商分配的航班号
- 航线:事故发生前飞行的完整或部分航线
- 型号:飞机型号
- 注册号:飞机的ICAO注册号
- 构造/序列号:飞机的构造号或序列号 / 机身号或机翼号
- 载客人数:飞机上的总人数
- 死亡人数:飞机上的总死亡人数
- 地面死亡人数:事故中在地面死亡的人数
- 生还者:飞机上的总生还者人数
- 生还率:生还者人数除以载客人数,表示为浮点数(%生还率)
- 简介:关于事故的简要描述及其原因(如已知)
- 簇ID:描述机上死亡人数的标签 - 布尔值(“高死亡率”,“低死亡率”)
其中,“高死亡率”空难指69至644名乘客的事故,平均载客人数为125人,平均生存率为6%;
“低死亡率”空难指94至517名乘客的事故,平均载客人数为178人,平均生存率为93%。
数据用途概述:
该数据集适用于航空安全分析、事故原因探究、生存率研究等多种场景。研究人员可以利用此数据比较“高死亡率”和“低死亡率”空难之间的差异,并探索可能的原因。此外,该数据集也可用于教育和培训,帮助学生和专业人士了解航空事故的历史和原因,提高公共安全意识。