数据集概述
该数据集包含从OpenSky网络采集的ADS-B飞行记录,用于评估航空数据领域的异常检测方法。数据覆盖葡萄牙LPPC和爱尔兰EGGX空域2020年1月特定时段的42个航班,含正常轨迹及注入的噪声、机动、着陆、起飞四种异常类型,分为训练、验证、测试集。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 数据目录(data/):
- 训练集文件: data/train.csv、data/train/目录下的单个航班CSV文件(如AEA052.csv),包含25个LPPC空域航班的正常轨迹数据。
- 验证集文件: data/validation.csv、data/validation/目录下的单个航班CSV文件(如NAX16L.csv),包含10个LPPC空域航班的正常轨迹数据。
- 测试集文件: data/test.csv、data/test/目录下按异常类型分类的子目录(manoeuver/、landing/、departing/、noise/),每个子目录含对应异常注入的航班CSV文件(如CFG114.csv),共7个EGGX空域航班数据。
- 异常轨迹文件: data/anomaly_departing.csv、data/anomaly_manoeuver.csv等,记录注入的异常轨迹数据。
- CSV文件字段示例: timestamp(时间戳)、icao24(飞机地址)、callsign(航班号)、longitude(经度)、latitude(纬度)、altitude(高度)、groundspeed(地速)、anomaly(异常标记)等。
- 图片目录(figures/):
- 10个PNG格式图片文件(如flights_train.png、inject_manoeuver.png),展示航班分布、异常注入示意图等可视化内容。
数据来源
OpenSky network
适用场景
- 航空安全研究: 开发和验证航班轨迹异常检测算法。
- 数据挖掘应用: 测试时间序列数据异常检测模型的性能。
- 航空交通管理: 分析正常与异常飞行轨迹的特征差异。
- 机器学习实验: 用于监督或半监督异常检测模型的训练与评估。