全球气象观测数据-2018年1月至2024年1月
数据来源:互联网公开数据
标签:气象,天气,观测,温度,降水,风速,气压,站点,地理位置,时间序列,气候,预测
数据概述:
本数据集包含2018年1月至2024年1月期间全球各地气象站的天气观测数据。虽然部分气象站可能在整个时间段内数据不完整,起始和结束日期各异,但不存在早于2018年或晚于2024年的数据。
数据集包含12个字段:
time(时间):观测日期,例如"2021-01-03"代表2021年1月3日。数据类型为日期时间格式"yyyy-mm-dd",其中"yyyy"代表年,"mm"代表月,"dd"代表日。
tavg(平均温度):每日平均气温,单位为摄氏度。例如-15.9, 18.4, 14.2等。该特征可用于预测每日温度趋势,如每周或每日预报。如果同时存在tmax和tmin,可以计算为(tmax + tmin) / 2。数据类型为float32。
tmin(最低温度):每日最低气温,单位为摄氏度。该值可正可负。数据类型为float32。
tmax(最高温度):每日最高气温,单位为摄氏度。与tmin类似,该值可正可负。数据类型为float32。
prcp(降水量):降水量,单位为毫米(mm)。数据类型为float32。
snow(降雪量):降雪量,单位为毫米(mm)。该列通常包含NULL值,因为近年来许多地区未观测到降雪。
wdir(风向):风向,单位为度。数据类型为float32。
wspd(最大风速):每日最大风速,单位为千米/小时(km/h)。数据类型为float32。
pres(气压):大气压,单位为百帕(hPa)。数据类型为float32。
station(站点):气象站的唯一ID。该字段可用于识别特定站点及其位置,有助于理解区域气候条件。
latitude/longitude(经纬度):气象站的地理坐标(以度为单位)。这些坐标有助于精确定位站点位置。数据类型为float32。
region(区域):使用标准区域代码指定收集数据的区域(例如,"SM"代表圣马力诺,"SA"代表沙特阿拉伯)。关于区域代码的更多信息,可以通过简单的Google搜索获得,如"{区域名称} region code"。
country(国家):ISO国家代码,代表气象站所在的国家(例如,"MA"代表摩洛哥,"DE"代表德国,"UA"代表乌克兰,"JP"代表日本)。国家代码可以在线轻松查阅。
数据用途概述:
该数据集可用于训练机器学习(ML)和人工智能(AI)模型,以进行各种地区的天气预报,并具有高精度。数据集可以支持诸如每日、每周和长期天气预报等任务。该数据集也可用于测试包含批判性思维算法的AI模型。使用时请注明数据来源并附上Kaggle数据集链接。