数据集概述
本数据集包含美国全国范围内的流感监测数据,数据来源于美国疾病控制与预防中心(CDC)的两个核心监测系统:门诊流感样疾病监测网络(ILINet)和国家呼吸道及肠道病毒监测系统(NREVSS)合作实验室。数据集时间跨度从1997年至2025年,共包含超过3400条按周汇总的记录,全面反映了美国流感活动的长期趋势、季节性模式以及病毒亚型的流行情况。
数据内容
该数据集由四个文件组成,分别记录了门诊监测和实验室监测两方面的数据,总计包含3,443条记录。
- ILINet.csv: 包含1,461条记录,覆盖1997年至2025年。记录了美国门诊流感样疾病(ILI)的就诊情况,包括加权和未加权的ILI百分比、各年龄组就诊人数、总就诊人数及提供数据的医疗机构数量。
- ICL_NREVSS_Public_Health_Labs.csv: 包含520条记录,覆盖2015年至2025年。记录了公共卫生实验室的流感病毒检测数据,包括总送检样本数以及甲型(A)和乙型(B)流感病毒各亚型的阳性检出数量。
- ICL_NREVSS_Clinical_Labs.csv: 包含521条记录,覆盖2015年至2025年。记录了临床实验室的流感病毒检测数据,包括总送检样本数、甲型和乙型流感阳性总数及阳性率。
- ICL_NREVSS_Combined_prior_to_2015_16.csv: 包含941条记录,覆盖1997年至2015年。提供了2015-16流感季之前的综合实验室监测历史数据。
字段定义
数据集包含以下核心字段类别:
- 通用信息:
REGION TYPE: 地区类型,主要为国家级(National)
REGION: 具体地区,数据中为国家级汇总
YEAR: 年份
WEEK: 一年中的第几周
- ILINet门诊监测字段:
% WEIGHTED ILI: 加权流感样疾病就诊百分比
%UNWEIGHTED ILI: 未加权流感样疾病就诊百分比
ILITOTAL: 流感样疾病就诊总人数
TOTAL PATIENTS: 门诊总就诊人数
NUM. OF PROVIDERS: 提供数据的医疗机构数量
AGE 0-4 至 AGE 65: 各年龄段流感样疾病就诊人数
- NREVSS实验室监测字段:
TOTAL SPECIMENS: 总送检样本数
PERCENT POSITIVE: 样本检测阳性率
TOTAL A: 甲型流感阳性总数
TOTAL B: 乙型流感阳性总数
A (2009 H1N1), A (H3), BVic, BYam等: 各流感病毒亚型的阳性检出数量
数据特征
该数据集具有显著的时间跨度和数据完整性优势。数据记录长达二十八年,从1997年延续至2025年,为进行长期趋势分析、历史疫情回顾(如2009年H1N1大流行)和季节性模式研究提供了坚实基础。数据以周为单位进行汇总,提供了高分辨率的时间序列,能够精确捕捉流感活动的短期波动和爆发高峰。此外,数据集整合了门诊症状监测(ILI)和实验室病原学确认(NREVSS)两种来源的数据,为全面评估流感负担提供了互补的视角。整体数据缺失率极低,均低于百分之零点二,确保了数据的高质量和分析结果的可靠性。
适用场景
本数据集适用于以下分析与应用场景:
- 流行病学研究:分析流感活动的季节性、周期性和长期趋势
- 疫情预测与预警:构建时间序列模型预测未来流感季的强度和高峰时间
- 公共卫生政策评估:评估疫苗接种、社交隔离等干预措施对流感传播的影响
- 病毒演变研究:追踪不同流感病毒亚型的流行优势变化
- 医疗资源规划:根据历史数据预测医疗系统在流感季期间可能面临的压力
- 学术教学:作为公共卫生、数据科学和统计学领域的经典教学案例
- 跨季节比较分析:对比不同流感季节的严重程度、持续时间和主要流行株
数据来源
美国疾病控制与预防中心(CDC)的美国门诊流感样疾病监测网络(ILINet)和国家呼吸道及肠道病毒监测系统(NREVSS)。