印度COVID-19模拟患者数据集1963-2021

印度COVID-19模拟患者数据集1963-2021 数据来源:互联网公开数据 标签:COVID-19,模拟数据,患者特征,症状分析,机器学习,统计建模,数据质量 数据概述: 本数据集包含100万个模拟COVID-19患者的记录,旨在反映COVID-19诊断和患者特征的各种现实方面。数据集涵盖了人口统计信息、临床症状、既往病史(合并症)以及其他在COVID-19诊断和结果中具有重要意义的因素。目标标签Is_Covid_True是根据关键症状和接触史的逻辑条件分配的,使数据集具有科学洞察力,尤其适用于机器学习和统计建模分析。 数据用途概述: 该数据集适用于COVID-19预测模型的训练和测试、风险评估、症状分析、统计分析、假设检验、缺失数据处理方法评估、插补技术评估和探索性数据分析等多种场景。研究人员可以使用此数据集评估不同症状和人口统计因素对COVID-19结果的影响,投资机构可以借助数据识别潜在的投资机会,政策制定者可以利用数据评估相关政策的有效性。 数据集包含100万行和31列,包括人口统计信息、症状和结果。数据集中存在缺失值,以模拟现实中的数据质量问题。 主要字段及其定义如下:

  • Patient_ID: 每个患者的唯一标识符
  • Name: 随机生成的姓名(使用Faker库)
  • Age: 整数值,范围为1到100
  • Gender: 分类特征,值为“Male”(男性)、“Female”(女性)和“Other”(其他)
  • Blood_Pressure: 血压读数(80-180毫米汞柱)
  • Heart_Rate: 心率(每分钟60-120次)
  • Fever: 布尔值,表示患者是否有发热
  • Cough: 布尔值,表示是否有咳嗽
  • Sore_Throat: 布尔值,表示是否有喉咙痛
  • Fatigue: 布尔值,表示是否有疲劳症状
  • Headache: 布尔值,表示患者是否有头痛
  • Breathlessness: 布尔值,表示是否有呼吸困难
  • Loss_of_Smell_Taste: 布尔值,表示是否有嗅觉或味觉丧失
  • Diarrhea: 布尔值,表示是否有胃肠道症状
  • Chest_Pain: 布尔值,表示是否有胸痛
  • Body_Ache: 布尔值,表示是否有肌肉痛或身体疼痛
  • Runny_Nose: 布尔值,表示是否有流鼻涕
  • Vomiting: 布尔值,表示是否有呕吐
  • Diabetes: 布尔值,表示患者是否有糖尿病
  • Hypertension: 布尔值,表示患者是否有高血压
  • Asthma: 布尔值,表示患者是否有哮喘
  • Obesity: 布尔值,表示患者是否肥胖
  • Smoking: 布尔值,表示患者是否吸烟
  • Vaccinated: 布尔值,表示患者是否接种过疫苗
  • Travel_History: 布尔值,表示患者是否有近期旅行史
  • Contact_with_Positive: 布尔值,表示患者是否与COVID-19阳性个体有过接触
  • Comorbidity_Count: 患者拥有的合并症数量(0-5)
  • ICU_Admission: 布尔值,表示患者是否被收治在ICU
  • Hospitalization_Days: 患者住院的天数
  • Is_Covid_True: 目标标签,布尔值,表示患者是否可能为COVID-19阳性,基于症状和条件 目标标签Is_Covid_True的逻辑: 目标列基于以下条件分配:

  • 出现关键症状,如发热、咳嗽、呼吸困难或嗅觉/味觉丧失

  • 与COVID-19阳性个体有过接触或有近期旅行史 未来工作:
  • 添加疫苗接种日期和COVID-19变异株等特征
  • 创建反映症状演变和新条件的不同疫情波的数据集
  • 扩展数据集以包含国际数据,以实现更广泛的应用 引用: 如果您使用该数据集,请向作者和本存储库致谢。欢迎对数据集进行改进或扩展。
packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 24.89 MiB
最后更新 2025年4月24日
创建于 2025年4月24日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。