Reddit平台Amber-Heard相关帖子数据集-文本分析-2021年6月至2022年9月
数据来源:互联网公开数据
标签:Reddit,AmberHeard,帖子,社交媒体分析,文本分析,舆情分析,数据挖掘
数据概述:
本数据集包含了Reddit平台上关于Amber Heard的帖子数据,涵盖了2021年6月至2022年9月的时间范围。 Amber Heard是一位美国女演员,因其与演员Johnny Depp的婚姻和随后的法律纠纷而备受关注,相关讨论在社交媒体上引发了广泛的关注。 该数据集来源于RescueSocialTech的研究,旨在分析Reddit上关于Amber Heard的信息传播和用户互动。
数据集概况:
2021年帖子数量: 39,482篇 Reddit帖子
2022年帖子数量: 242,143篇 Reddit帖子
参与账号数量: 92,608个账户
账户创建年份: 账户创建年份范围为2006年至2022年
数据来源:
该数据集来源于以下GitHub仓库:
https://github.com/RescueSocialTech/Amber-Heard_Disinformation_Operations_Bots
关于2018年至2021年的数据分析,请参考Kaggle上的相关数据集和GitHub上的分析报告。
数据用途概述:
该数据集可用于多种社交媒体分析和研究场景。 研究人员可以使用此数据进行:
舆情分析: 分析用户对Amber Heard的帖子和态度,了解公众情绪。
话题追踪: 追踪与Amber Heard相关的话题,例如事件、争议等。
社交网络分析: 分析用户之间的互动关系,例如评论、点赞、分享等。
Disinformation检测: 识别和分析可能存在的虚假信息或恶意行为(bots)。
Bot检测: 检测和分析参与互动的机器人账号(Bots)。
情感分析: 分析帖子的情感倾向(积极、消极、中性)。
用户行为分析: 分析用户在Reddit上的行为模式,例如发帖频率、参与度、互动等。
内容分析: 分析帖子的内容特征,例如关键词、主题等。
时间序列分析: 分析帖子数量、情感变化等在时间上的趋势。