Twitter金融话题文本数据印度Nifty502017-2022
数据来源:互联网公开数据
数据来源:
本数据集收集自社交媒体平台,包含带有话题标签 nifty50 的推文,时间范围从 2017年9月 至 2022年9月,适用于金融情绪分析、股市舆情研究和自然语言处理模型训练。
数据内容:
该数据集记录了五年内包含 nifty50 标签的推文文本,反映了与印度国家证券交易所基准指数 Nifty 50 相关的市场讨论与投资者观点。可用于建立金融情绪识别模型、预测市场趋势、研究社交媒体与市场波动之间的关系等。
字段定义(示例字段,具体视数据集结构而定):
tweet_id:推文唯一标识
timestamp:推文发布时间
username:发布用户的账号名(如已包含)
text:推文正文内容(包含nifty50)
retweet_count:转发数量
like_count:点赞数量
reply_count:回复数量
source:发布推文的平台(如iPhone、Web等)
时间范围:
2017年9月 - 2022年9月,覆盖五年时间序列,适合长周期金融情绪演化与事件驱动分析。
数据格式:
结构化CSV或JSON格式,文本为主,可结合数值型与时间型字段进行多维度分析。
更新频率:
该数据集为历史数据快照,不包含实时更新。如需扩展,可基于同类爬虫策略进行追加收集。
适用场景:
金融情绪分析与可视化
股票市场社交舆情建模
文本情感分类与关键词提取
社交媒体与市场波动的相关性研究
股票走势预测辅助特征构建
NLP模型在金融文本上的微调与评估
标签:Nifty50,股票市场,社交媒体,金融文本分析,推文数据,情绪分析,自然语言处理,时间序列,舆情研究,印度股市,NLP数据集