COVID-19每日数据分析集-2020至2023-craigphillips
数据来源:互联网公开数据
标签:COVID-19,数据分析,传染病,预测模型,回归曲线,SIR模型,全球疫情
数据概述:
本数据集包含自2020年1月22日以来COVID-19每日疫情数据,涵盖了全球多个国家和地区的确诊病例数。数据主要用于构建预测模型,以估算各国/地区的最大确诊病例数,并生成相应的时间线。数据集特别关注了中国(尤其是湖北省)和韩国的疫情发展情况,并基于这些地区的数据拟合了回归曲线,其中S形曲线拟合模型尤为重要,尽管其他模型可能具有更好的拟合度(r2),但S形曲线的参数具有实际意义,便于用户理解。
数据用途概述:
该数据集适用于疫情预测、数据分析、政策制定等多种场景。数据分析人员可以利用数据构建预测模型,评估疫情未来的发展趋势;政策制定者可以依据模型结果制定相应的防控措施;研究人员可以利用数据进行传染病模型研究,提高对病毒传播机制的理解。此外,该数据集还适用于教学和科普活动,帮助公众更好地了解COVID-19疫情的发展情况和防控策略。
数据集内容:
- 确诊病例数:各国/地区每日新增和累计确诊病例数。
- 回归曲线拟合结果:基于湖北省和韩国的疫情数据拟合的S形曲线模型参数。
- 时间线:各国/地区疫情发展的预计时间线。
数据集参考:
- 基于covid-19-digging-a-bit-deeper和COVID Global Forecast: SIR model + ML regressions数据集进行研究。
- 该数据集受到Tomas Pueyo在Medium文章“Coronavirus: The Hammer and the Dance”中的启发,特别关注了疫情发展的“Hammer and the Dance”现象,即严格的防控措施(Hammer)和逐步放宽限制的策略(Dance)。