新闻内容文本相似度与股票收益同步性数据集2013_2022

数据集概述

本数据集包含2013-2022年中国4102家非金融类上市公司的82215条观测记录,核心内容为新闻文本相似度(基于TF-IDF余弦相似度计算)与股票收益同步性(通过市场模型回归R²衡量)的关联数据,覆盖新闻处理、股票交易及财务等多维度信息。

文件详解

  • 数据文件(.dta格式,共15个):
  • 包含ASVImonthly.dta、base_data.dta、BellWether_Newsprop.dta、DisAcc.dta、isAnnoym.dta、NewsNumlarge8ym.dta、numAholder_yq.dta、ReportSim_ym.dta、Rmkt.dta、sigma_mkt.dta、Stkcd_ym_NewsTone.dta、Topic_wordscomovement.dta、yearMDATone.dta、ymChinaNewsBasedEPU.dta、ymCICSI.dta
  • 字段涵盖公司标识、时间戳、新闻文本相似度得分、股票收益同步性R²值、新闻情感倾向、市场基准数据等核心指标
  • 代码文件(.do格式,1个):
  • code.do:可能为数据处理或分析的Stata代码文件

数据来源

中国股票市场和会计研究(CSMAR)数据库、中国研究数据服务平台(CNRDS)

适用场景

  • 金融市场信息扩散机制研究
  • 媒体叙事对资产价格联动的影响分析
  • 投资者信息多样性与股票收益同步性的关联探究
  • 文本分析技术在金融领域的应用验证
  • 市场模型回归与R²统计量的实证研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 28.03 MiB
最后更新 2025年11月28日
创建于 2025年11月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。