标有GCPNLP情绪标签的股票市场推文数据集

标有GCPNLP情绪标签的股票市场推文数据集 数据来源:互联网公开数据 标签:股票市场,推文,情绪分析,GCP,NLP,金融分析,数据科学,人工智能 数据概述: 本数据集包含2020年4月9日至7月16日期间与股票市场相关的推文,数据来源于现有数据集“Stock Market TWEETS Data-NLP-2021”。原始数据集中共收集了943,9672条推文,使用了S&P 500标签(SPX500)、标普500指数中前25家公司的引用以及Bloomberg标签(stocks)。然而,在原始数据集中,仅提供了943,672条推文,其中仅有1300条推文标注了情绪得分,占比较小。为了对剩余的数据进行标注,我们使用了Google Cloud NLP API的 sentiment analysis功能,最终标注了12,591条推文。尽管对所有数据进行标注的成本较高,但可以信赖Google Cloud NLP API的情绪得分。 数据用途概述: 该数据集在股票市场情绪分析、金融分析、自然语言处理以及数据科学等领域具有广泛的应用价值。研究人员可以利用此数据集进行股票市场情绪趋势的研究,投资者可以根据推文情绪预测市场动态,金融机构可以利用情绪分析优化风险管理和投资策略,数据科学家和AI工程师可以将该数据集用于机器学习模型的训练和评估。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.79 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。