数据集概述
本数据集包含Twitter平台上特定事件及名人相关的级联推文元数据,覆盖2015年尼泊尔地震、2018年印度板球超级联赛(IPL)、西班牙15-M运动,以及2010年Lady Gaga及其粉丝的推文内容,记录了推文传播链、用户交互等信息,支持社交媒体级联传播研究。
文件详解
- 2015尼泊尔地震数据集
- 文件名称:Nepal_2015_earthquake.zip
- 文件格式:ZIP
- 字段映射介绍:包含followers_network(每行一个用户的关注者ID列表)、timeseries.txt(每行一个级联的转发时间戳排序)、userseries.txt(每行一个级联的转发用户序列排序)
- 2018 IPL数据集
- 文件名称:IPL2018.zip
- 文件格式:ZIP
- 字段映射介绍:包含cascade-intervals-IPL.txt(每行一个级联的转发时间间隔序列)
- 15-M运动数据集
- 文件名称:15m.zip
- 文件格式:ZIP
- 字段映射介绍:包含.csv和.txt文件,每行一条推文元数据,字段为idt(推文ID)、segs(推文分段号)、hashtags(空格分隔的标签集)、mentions(提及的用户ID)
- Lady Gaga相关数据集
- 文件名称:LadyGaga-2010.zip
- 文件格式:ZIP
- 字段映射介绍:包含推文元数据,字段为User_Name(用户名)、Tweet_ID(推文ID)、Time(时间)、Via(发布渠道)、retweet_from(转发来源)、reply_to_user(回复用户)、reply_to_tweet(回复推文ID,非回复为-1)、content(内容)、Number_of_link_in_tweet(链接数量)、type_of_linkX(链接类型X)、linkX(链接X)
适用场景
- 社交媒体级联传播分析: 研究特定事件(地震、赛事、运动)及名人相关推文的传播路径、速度和范围
- 事件舆情监测: 分析2015尼泊尔地震、2018 IPL等事件期间Twitter平台的用户讨论热点与情绪趋势
- 名人影响力研究: 基于Lady Gaga及其粉丝的推文数据,探究名人在社交媒体中的传播力和粉丝互动模式
- 网络交互模式挖掘: 通过转发时间间隔、提及关系等数据,分析Twitter用户的交互行为特征
- 信息传播动力学建模: 利用级联时间序列数据,构建社交媒体信息传播的数学模型与预测方法