数据集概述
本数据集包含美国上市公司董事会领导力数据库及配套机器学习脚本,数据库通过监督学习扩展人工编码数据生成,涵盖CEO二元性、董事会主席定位等变量;脚本用于训练模型及对企业委托书相关变量评分,支持其他结构数据的扩展应用,共9个文件。
文件详解
- 文档文件
- 文件名称:Board Leadership Dataset & Tool (ReadMe).docx
- 文件格式:DOCX
- 字段映射介绍:数据集及工具的说明文档
- 数据库文件
- 文件名称:board-leadership-dataset_2025-05-28.dta
- 文件格式:DTA
- 字段映射介绍:含textid、cik、year、filingmonth、filingday、text、duality_prob、duality_bin、control_prob、control_bin、collab_prob、collab_bin等字段的董事会领导力数据库
- 文件名称:board-leadership-dataset_2025-05-28.csv
- 文件格式:CSV
- 字段映射介绍:与上述DTA文件内容一致的CSV格式数据库
- 训练数据文件
- 文件名称:train-duality.csv
- 文件格式:CSV
- 字段映射介绍:含textid、cik、year、text、duality字段的二元性训练数据
- 文件名称:train-contcoll.csv
- 文件格式:CSV
- 字段映射介绍:董事会相关变量的训练数据
- 代码文件
- 文件名称:scoring.py
- 文件格式:PY
- 字段映射介绍:对企业委托书变量评分的脚本
- 文件名称:training_cv_tfidf.py
- 文件格式:PY
- 字段映射介绍:基于TF-IDF的交叉验证训练脚本
- 文件名称:training_d2v_w2v.py
- 文件格式:PY
- 字段映射介绍:基于Doc2Vec和Word2Vec的训练脚本
- 文件名称:training_lda.py
- 文件格式:PY
- 字段映射介绍:基于LDA的训练脚本
适用场景
- 企业治理研究:分析美国上市公司CEO二元性、董事会主席定位等特征与企业治理的关系
- 机器学习应用:利用脚本训练模型,对企业委托书相关变量评分
- 数据扩展分析:适配训练/评分脚本,扩展人工编码数据至其他结构或指标
- 金融学术研究:支撑董事会领导力与企业绩效、决策等关联的学术分析
- 企业信息挖掘:从企业委托书中提取董事会相关变量,辅助企业管理决策