数据集

新冠疫情全球预测增强数据集-2020年8月

新冠疫情全球预测增强数据集-2020年8月数据来源：互联网公开数据标签：新冠疫情,预测,流行病学,时间序列,人口统计,健康数据,死亡率,发病率,logistic回归

数据概述：本数据集是针对“新冠疫情全球预测（第1周）”竞赛的增强数据集。原始训练集和测试集均已通过添加相同国家的数据进行增强。数据中增加了针对“确诊病例”和“死亡病例”的Logistic回归拟合，并附带协方差信息。此外，还整合了联合国公开的家庭规模和人口数据，以及来自Our World in Data的部分健康数据。

数据集中包含以下重要字段，这些字段对于新冠疫情的预测具有重要意义：

days_since_first100cases：自首次出现100例确诊病例以来的天数。 y_Fatalities：死亡病例的Sigmoid函数估计值。 y_ConfirmedCases：确诊病例的Sigmoid函数估计值。 life_expectancy_years：预期寿命（年）。 veg_supply_person_kg_year：人均蔬菜供应量（公斤/年）。 respiratory_infections_death%：呼吸道感染死亡人数占总人口的百分比。 deaths_from_smoking%：吸烟导致的死亡人数占总人口的百分比。 young%：年轻人占总人口的百分比。 old%：老年人占总人口的百分比。 population：总人口。 fem%：女性人口占比。 number_doc_per1000：每千人拥有的医生数量。 hh%1：单人家庭占比。 hh%2-3：2-3人家庭占比。 hh%4-5：4-5人家庭占比。 hh%6+：6人及以上家庭占比。

数据用途概述：该数据集主要用于新冠疫情的预测模型构建、疫情传播趋势分析、不同国家疫情发展对比研究等。研究人员可以利用此数据探索影响疫情传播的因素，评估不同国家采取的防控措施的效果，并进行预测模型的优化。此外，该数据集也适用于流行病学研究、公共卫生政策制定以及相关教育培训。

数据与资源

新冠疫情全球预测增强数据集-2020年8月.zipZIP
0.48 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.48 MiB
最后更新	2025年4月15日
创建于	2025年4月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

新冠疫情全球预测增强数据集-2020年8月

数据与资源

附加信息

注册成功！