数据集概述
本数据集是面向数据流预测的大规模基准数据集WaterBench-Iowa,遵循FAIR数据原则,整合美国联邦及州机构(NASA、NOAA、USGS、爱荷华洪水中心)的流量、降水、流域面积、坡度、土壤类型、蒸散量等数据,提供高时空分辨率的时序数据及关系信息,支持机器学习与深度学习研究,弥补地球科学领域统一基准的缺失。
文件详解
- 文件名称:readme.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集及代码说明,提供DOI链接,说明数据集覆盖美国爱荷华州125个流域、2011年10月1日至2018年9月30日的7类特征时序数据
- 文件名称:codes.zip
- 文件格式:ZIP
- 字段映射介绍:数据集相关代码压缩包,用于数据处理或模型运行
- 文件名称:catchment_relationship.csv
- 文件格式:CSV
- 字段映射介绍:包含station_id(站点ID)、upstream_id(上游站点ID)两个字段,记录流域站点间的上下游关系
- 文件名称:data_time_series.zip
- 文件格式:ZIP
- 字段映射介绍:包含125个CSV文件,存储各流域的时序数据,涵盖降水、流量、蒸散量等特征
数据来源
NASA、NOAA、USGS、Iowa Flood Center
适用场景
- 水文预测模型开发: 用于训练和验证数据驱动的小时级数据流预测机器学习模型
- 深度学习基准测试: 基于数据集提供的基准性能,对比不同深度学习架构在水文预测任务中的效果
- 流域关系分析: 利用catchment_relationship.csv研究流域站点间的上下游关联对流量的影响
- 多源水文数据整合研究: 分析降水、蒸散量等多特征与流量的相关性,支撑水文过程机理探索
- 地球科学机器学习应用: 作为统一基准,推动水文领域机器学习方法的标准化对比与发展