印度尼西亚股票市场预测新闻与股价数据集2008-2016
数据来源:互联网公开数据
标签:股票市场,预测,新闻分析,深度学习,NLP,时间序列,金融市场
数据概述:
本数据集旨在用于股票市场预测的研究和学习,包含两个主要数据渠道:新闻数据和股票数据。新闻数据来源于Reddit的WorldNews频道(/r/worldnews),选取了2008年6月8日至2016年7月1日期间,根据用户投票排名的每日前25条新闻标题。股票数据采用了道琼斯工业平均指数(DJIA)作为研究对象,数据范围为2008年8月8日至2016年7月1日。数据集提供了三种CSV格式的文件:RedditNews.csv包含新闻日期和标题;DJIA_table.csv包含直接从雅虎财经下载的DJIA数据;Combined_News_DJIA.csv整合了日期、标签和25条新闻标题,便于学生和研究者使用。
数据用途概述:
该数据集适用于股票市场预测、新闻影响分析、深度学习和自然语言处理等研究场景。研究人员可以利用新闻数据与股票价格之间的关联探索市场动态;学生则可以通过实际数据操作,加深对模型训练和预测过程的理解。此外,数据集也适合用于教育培训,帮助学习者掌握新闻情感分析与股票市场预测的结合应用。
举例:
数据集中,2008年6月8日的新闻标题按热度排序的前25条,以及当天的DJIA收盘价被整合在Combined_News_DJIA.csv文件中。通过分析这些数据,研究者可以研究新闻对股市的影响,并尝试构建预测模型。