数据集概述
本数据集围绕干旱气候下的太阳辐射预测展开,包含基于优化人工神经网络(ANN)模型的实验数据、训练代码、解释性分析结果及可视化文件,通过SHAP和LIME方法实现模型可解释性,覆盖沙特阿拉伯多个城市的气象数据处理与预测全流程。
文件详解
该数据集包含多种类型文件,具体说明如下:
- 数据文件(.csv格式):
- 城市汇总数据:如alula_summary.csv、tabuk_summary.csv等,包含各城市太阳辐射及气象特征的统计信息(如均值、计数)
- 处理后数据:如alula_processed.csv,为模型训练准备的结构化数据
- 模型结果数据:如multi_city_metrics.csv(多城市模型评估指标)、multi_city_results.csv(预测结果)、abha_xai_importance.csv(特征重要性分析)
- 分布:共33个.csv文件,占比50.77%
- 代码文件(.ipynb及.py格式):
- Jupyter Notebook文件:如Multi_City_Model_Training-checkpoint.ipynb(模型训练)、Multi_City_EDA-checkpoint.ipynb(探索性数据分析)、Multi_City_XAI_Explainer_Optimized-checkpoint.ipynb(可解释性分析),共14个
- Python脚本:如convert_nasa_power_to_csv.py(数据格式转换)、Inspect_structure.py(结构检查),共4个
- 配置与元数据文件(.json格式):
- city_metadata.json:记录5个城市的地理信息(经纬度)
- 城市NASA POWER数据:如AlUla_nasa_power.json,存储原始气象数据
- 分布:共6个.json文件
- 可视化文件(.png格式):
- 预测结果图:如riyadh_forecast.png、abha_forecast.png等,展示各城市太阳辐射预测曲线
- 分布:共5个.png文件
- 文档文件(.txt及.md格式):
- README.md:项目说明文档,介绍框架功能及流程
- requirements.txt:环境依赖清单(如pandas、tensorflow、shap等)
- 分布:共3个文档文件
适用场景
- 可再生能源研究:分析干旱气候下太阳辐射预测模型的性能与优化方法
- 机器学习应用:探索人工神经网络在气象预测任务中的可解释性实现(SHAP/LIME方法)
- 气候数据分析:研究沙特阿拉伯多城市气象特征与太阳辐射的关联
- 模型工程实践:复现多城市太阳辐射预测的全流程(数据处理、特征工程、模型训练)
- 可解释AI研究:验证SHAP和LIME在优化神经网络模型中的解释效果