数据2023_2024流感季新浪微博平台数据集

数据集概述

本数据集包含2023年10月至2024年3月流感季新浪微博#流感#话题的公开数据,含439条帖子及4968条评论的基础信息,同时提供该话题的关键词与停用词文件,用于情感分析、内容分析及情绪传染模式研究。

文件详解

该数据集包含3个文件,具体说明如下: - 数据文件: - data_blinded.xlsx:Excel格式文件,包含帖子(用户名、用户ID、发布时间、内容、IP城市定位)及对应评论(评论者用户名、ID、评论时间、内容、IP城市定位)的脱敏数据 - 词典文件: - related term dictionary_flu.txt:TXT格式文件,存储#流感#话题相关关键词,如“乙流”“甲型流感病毒”“蓝芩口服液”等 - stopwords_cn_flu.txt:TXT格式文件,存储中文停用词,用于文本分析时过滤无意义词汇

适用场景

  • 公共卫生舆情分析:研究流感季公众对流感的讨论热点与关注方向
  • 情感传播研究:分析网民对流感相关内容的情绪倾向及传染模式
  • 文本挖掘应用:基于关键词词典开展话题词云绘制、主题建模等文本分析
  • 公共卫生干预策略:通过模拟干预探索缓解负面情绪传播的有效途径
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 1.52 MiB
最后更新 2025年11月26日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。