金融社区讨论文本数据集-2021至2023年-paolodelia

金融社区讨论文本数据集-2021至2023年-paolodelia 数据来源:互联网公开数据 标签:金融,投资,市场趋势,文本分析,自然语言处理,Reddit,社会媒体,话题建模

数据概述: 本数据集包含从多个主要金融Reddit社区(r/investing, r/finance, r/options等)收集的帖子文本数据。数据通过Python Reddit API Wrapper (praw)和Pushshift API下载,涵盖了2021年至2023年间用户在这些社区的讨论内容。数据集适用于需要大量金融文本数据的研究和分析场景。

数据用途概述: 该数据集适用于多种自然语言处理任务,如情感分析(检测市场中的恐惧或 hype 情绪)、主题建模(识别讨论的主要话题)、趋势跟踪(分析市场动态)以及其他相关研究。数据集中的文本数据为金融市场的研究者、投资者和从业者提供了丰富的数据资源,支持他们进行深入的分析和洞察。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 98.29 MiB
最后更新 2025年5月4日
创建于 2025年5月4日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。