股票与情绪分析数据集-2023-natthitatangsriwong
数据来源:互联网公开数据
标签:股票,情绪分析,金融指标,技术指标,新闻,市场趋势,投资决策
数据概述:
本数据集包含三部分核心文件,分别是股票与情绪合并数据、新闻数据和股票价格历史数据,为研究股票市场与情绪分析提供了丰富的数据支持。
- 合并数据文件 merged_data_sentiment.csv:
该文件整合了金融指标与情绪分析数据,包含1,986行和19列。字段包括:
- timestamp: 数据记录的时间戳
- ticker: 股票代码
- open, high, low, close: 股票的开盘价、最高价、最低价和收盘价
- volume: 交易量
- y_true: 股价的真实变动方向(上涨或下跌)
- EMA: 股价的指数移动平均线
- RSI: 相对强弱指数,一种技术指标
- description: 与股票或事件相关的简要描述
-
sentiment_polygon, TextBlob_Sentiment, VADER_Sentiment, FinGPT_Sentiment, FinBERT_Sentiment: 不同工具生成的情绪得分
-
新闻数据文件 news_polygon.csv:
该文件包含新闻文章的相关信息,包括来源、内容及提到的股票代码,共计100,000行和12列。字段包括:
- id: 每篇文章的唯一标识符
- publisher: 新闻来源
- title: 文章标题
- author: 作者
- published_utc: 发布时间(UTC)
- article_url: 文章链接
- tickers: 文章中提及的股票代码
- description: 文章摘要
- keywords: 文章中的关键词
-
insights: 文章相关洞察,包括对股票代码的情绪分析
-
股票价格历史数据文件 stock_price.csv:
该文件记录了不同公司的历史股票价格数据,包含1,986行和10列。字段包括:
- timestamp: 股票数据的时间戳
- ticker: 股票代码
- open, high, low, close: 股票的开盘价、最高价、最低价和收盘价
- volume: 交易量
- y_true: 股价的变动方向(上涨或下跌)
- EMA: 股价的指数移动平均线
- RSI: 相对强弱指数
数据用途概述:
该数据集适用于金融分析、市场趋势预测、情绪分析与投资决策等多种场景。研究者可以利用该数据集进行股票价格波动预测、情绪分析技术比较、新闻对股市影响评估等研究。此外,该数据集也适合用于金融教育,帮助学习者更好地理解金融市场动态和量化分析方法。