罗宾汉用户股票参与度与股票价格关系数据集-2019年9月至2020年7月
数据来源:互联网公开数据
标签:股票,罗宾汉,零售交易,用户参与度,股票价格,市场分析,时间序列,金融
数据概述:
本数据集整合了股票价格数据与罗宾汉(Robinhood)平台用户股票持有数据,涵盖了约9000只股票,时间跨度为2019年9月至2020年7月。数据来源于Stooq网站提供的股票tick数据以及RobinTrack网站收集的罗宾汉用户参与度数据。数据集旨在研究零售交易在驱动资产价格方面的作用。
数据集包含两个主要文件:
-
Robinhood_Master_v1.csv: 这是主数据集,包含了每小时的股票tick数据和罗宾汉用户参与度数据。主要字段包括:
- Ticker: 股票代码
- Close: 收盘价
- High: 最高价
- Low: 最低价
- Open: 开盘价
- users_holding_first: 该时段内罗宾汉用户持有该股票的初始用户数量
- users_holding_last: 该时段内罗宾汉用户持有该股票的最终用户数量
- users_holding_max: 该时段内罗宾汉用户持有该股票的最高用户数量
- users_holding_min: 该时段内罗宾汉用户持有该股票的最低用户数量
-
df_apple_final.csv: 这是为苹果公司(AAPL)时间序列建模预处理的数据集。除了与主数据集相同的字段外,还包括:
- users_holding_1D_change: 罗宾汉用户持有苹果股票的日变化量
- users_holding_13D_change: 罗宾汉用户持有苹果股票的13天变化量
- Open_6D_change: 苹果股票开盘价的6天变化量
- Open_13D_change: 苹果股票开盘价的13天变化量
- SPY相关的用户持有量和开盘价变化量(SPY为标普500指数ETF)
此外,还提供了custom_functions.py文件,其中包含用于生成数据集中图表的自定义函数,以便于用户复现和分析。
数据用途概述:
该数据集可用于研究零售投资者行为对股票价格的影响,分析罗宾汉用户参与度与股票价格之间的关系。研究人员可以使用此数据进行时间序列分析、市场趋势预测、投资策略评估等。 此外,该数据集也适用于金融领域的教育和研究,例如股票市场行为分析、量化投资策略开发、以及零售投资者情绪对市场的影响分析等。