Reddit股票讨论帖子情感分析数据集-2018-2022

Reddit股票讨论帖子情感分析数据集-2018-2022

数据来源:互联网公开数据

标签:Reddit,股票,情感分析,社交媒体,文本分析,金融市场,AAPL,GME,MCD,MSFT,NFLX,NVDA,TSLA,Fama French模型

数据概述: 本数据集收录了2018年至2022年间Reddit平台上关于以下热门股票的帖子:AAPL(苹果), GME(游戏驿站), MCD(麦当劳), MSFT(微软), NFLX(奈飞), NVDA(英伟达), 和TSLA(特斯拉)。数据来源于Pushshift,并经过关键词筛选。

数据集包含以下文件:

posts.csv:2018年1月1日至2022年12月31日期间,提及上述股票的Reddit帖子。 stock_index.csv:每个帖子的ID及其提及的股票代码。 subreddit_subscribers.csv:截至2023年7月31日,posts.csv中所有子版块的订阅人数。

数据用途概述: 该数据集主要用于研究Reddit帖子情感对股票价格的影响。研究人员可以利用此数据进行文本情感分析,探讨Reddit讨论对股票市场的影响,并评估Fama-French三因子模型在这些股票上的解释力。此外,该数据集也适用于金融市场情绪分析、社交媒体数据分析、自然语言处理等领域的研究。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 09:12 (UTC)
创建于 五月 31, 2025, 09:11 (UTC)