数据集概述
本数据集包含十二份关于Twitter平台新出现谣言传播过程的实证研究结果,聚焦短期内兴衰且伴随反谣言传播的十二类谣言,如NFL球队更名、名人言论等。每份数据记录相关推文/转推的用户信息、发布细节及内容标注,总计十二份文件。
文件详解
- 数据集文件(共十二份)
- 文件名称:遵循
DATASET_R[1-12].xlsx模式(例如:DATASET_R10.xlsx)
- 文件格式:XLSX
- 字段映射介绍:每行对应一条推文/转推,包含以下核心字段:
- 用户信息:User ID(用户ID)、用户简介描述、用户发布推文总数、账号创建时间、语言、粉丝数、关注数
- 推文信息:发布时间、点赞数、转推数、是否包含嵌套内容、发布设备来源、推文/转推ID、转推ID(若为转推)、引用ID(若为引用)、回复ID(若为回复)
- 内容标注:重复频率、内容状态(r=谣言、a=反谣言、q=疑问、n=无关)
适用场景
- 社交媒体谣言传播机制研究: 分析新出现谣言在Twitter平台的传播路径、生命周期及用户参与特征。
- 谣言与反谣言互动分析: 探究反谣言内容对谣言传播的抑制或强化作用。
- 用户行为特征研究: 基于用户粉丝数、发布设备等信息,分析不同用户群体在谣言传播中的角色差异。
- 谣言内容标注与分类: 利用标注字段(r/a/q/n)训练或验证谣言检测模型。
- 社交媒体信息生态分析: 研究谣言内容在Twitter平台的重复传播规律及无关信息过滤机制。