数据集概述
本数据集为基于图表图卷积网络的中国股市 contagion风险预测研究配套数据,包含2007年1月至2022年12月的28个申万一级行业指数收盘价、沪深300指数收盘价及八大交易指标数据,同时提供数据处理与模型实现的代码文件。
文件详解
- 数据文件(位于Datasets/目录下):
- Sector_data.csv:CSV格式,存储28个行业的收盘价数据
- CSI_300_data.csv:CSV格式,包含沪深300指数收盘价及八大交易指标(换手率、市盈率、成交量、相对强弱指数、MACD、移动平均线、布林带、随机振荡器)
- DCC_temp.csv:CSV格式,预定义的临时文件,用于存储相关性计算结果
- 代码文件(位于Code/目录下):
- Descriptive_code.py:Python文件,用于计算统计结果
- ADF Test.py:Python文件,用于数据平稳性检验
- Min-max normalization.py:Python文件,用于数据标准化处理
- ADCC-GJR-GARCH.R:R语言文件,用于计算行业间动态条件相关性
- MST_figure.py:Python文件,用于构建行业关系复杂网络
- Correlation.py:Python文件,用于计算行业间相关性
- Corr_up.py、corr_mid.py、corr_down.py:Python文件,分别计算上、中、下游行业动态相关性
- Centrality.py:Python文件,用于量化网络节点重要性
- Averaging_corr_over_a_5-day_period.py:Python文件,计算5日滚动平均相关性及中心性指标
- Convert technical charts using PIP and VG methods.py:Python文件,提取技术图表特征并转换为图形表示,输出Daily Importance Score.csv、Daily Threshold Matrix.csv、Daily Technical Indicators.csv
- Convert_CSV_to_TXT.py:Python文件,将CSV格式的技术指标文件转换为TXT格式
- Generating and normalizing the subgraphs/目录:包含receptive_field.py(主程序)、stock_graph_indicator.py(计算拓扑结构数据)等4个Python文件,用于生成并标准化子图
- Predictive_model.py:Python文件,以标准化子图和 contagion 风险定义的Y值为输入,进行参数调优实现最优预测
数据来源
- Choice数据库(28个行业收盘价)
- Wind数据库(沪深300指数收盘价及八大交易指标)
适用场景
- 金融风险研究:分析中国股市行业间 contagion风险的动态变化
- 量化投资分析:基于行业相关性与网络结构优化投资组合
- 机器学习应用:验证图表图卷积网络在金融时间序列预测中的有效性
- 金融监管决策:为系统性风险监测提供数据与模型支持
- 金融市场机制研究:探究行业关联结构对风险传导的影响