数据集概述
本数据集包含法国及边界48个地点2024年初的历史气象观测与预报数据,用于机器学习训练。数据涵盖45个站点的观测记录及多分辨率数值预报结果,包含温度、风速、风向等气象要素,具有小时级时间分辨率。
文件详解
- 观测数据文件(MES_YYYY.csv)
- 文件名称:遵循
MES_YYYY.csv模式(YYYY为站点ID)
- 文件格式:CSV
- 字段映射介绍:每小时一条记录,字段包括Date(TU)(观测日期,格式DD/MM/YYYY HH:MM)、Temperature2m_degC(2米高度气温,单位℃)、WindSpeed10m_m/s(10米高度风速,单位m/s)、WindDirection10m_deg(10米高度风向,单位度);缺失值用"-999"表示
- 站点列表文件(Station_list.csv)
- 文件名称:Station_list.csv
- 文件格式:CSV
- 字段映射介绍:包含45个站点的ID、名称、纬度和经度信息
- 预报数据文件(XXX_YYYY.csv)
- 文件名称:遵循
XXX_YYYY.csv模式(XXX为预报模型ID,YYYY为网格输出位置ID)
- 文件格式:CSV
- 字段映射介绍:每小时一条预报记录,字段包括First date run (TU)(预报起始日期,格式DD/MM/YYYY HH:MM)、Forecast date(预报日期,格式DD/MM/YYYY HH:MM)、Temperature2m_degC(2米高度气温,单位℃)、WindSpeed10m_m/s(10米高度风速,单位m/s)、WindDirection10m_deg(10米高度风向,单位度);缺失值用"-999"表示
- 预报模型说明:"GFS0.25-Complet"为0.25°分辨率GFS模型,"LEXIS"为EVEREST项目LEXIS链WRF模型,"WRF3KM-Complet"为NUMTECH 3km分辨率WRF模型,"WRF12KM-Complet"为NUMTECH 12km分辨率WRF模型
适用场景
- 气象预测模型训练: 用于机器学习模型训练,提升温度、风速、风向等气象要素的预测精度
- 多分辨率预报效果评估: 对比不同分辨率(0.25°、3km、12km)数值预报模型的性能差异
- 气象站点数据挖掘: 分析45个站点的小时级观测数据,挖掘气象要素时空变化规律
- 气象缺失值插补研究: 基于现有观测与预报数据,开发缺失值插补算法
- 机器学习数据预处理实践: 作为气象领域机器学习项目的预处理案例,包括数据清洗、特征工程等