上市公司高管薪酬与文本分析数据集ExecutiveCompensationandTextAnalysisDataset-lemonlulu

上市公司高管薪酬与文本分析数据集ExecutiveCompensationandTextAnalysisDataset-lemonlulu

数据来源:互联网公开数据

标签:高管薪酬, SEC文件, 文本分析, 公司治理, 财务分析, 合同类型, 机器学习, 企业管理

数据概述: 该数据集包含来自美国证券交易委员会(SEC)披露的上市公司文件,记录了上市公司高管薪酬相关信息以及对应的文本内容,适用于公司治理、财务分析和文本挖掘等领域的研究。主要特征如下: 时间跨度:数据记录的时间范围覆盖多个年份,具体年份信息包含在数据集内,可根据“fyear”字段进行筛选。 地理范围:数据主要来源于美国上市公司,通过SEC文件进行披露。 数据维度:数据集包含多个CSV文件,主要字段包括:公司识别码(cik)、财年(fyear)、文件名称(file)、公告年份(ann_year)、数据日期(datadate)、公司股票代码(gvkey)、管理层讨论与分析文本(cda_text)、错误信息(error)、原始数据(raw_data)、合同类型(contract_type)、维度信息(dimension)、细节信息(details)、指标(metrics)以及分析结果(analysis_result)。 数据格式:数据以CSV格式提供,包含多个文件,如employee.csv、all_clean_1_part1.csv等,便于数据分析和处理。其中,cda_text字段包含管理层讨论与分析文本,可用于文本分析。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于公司治理、高管薪酬、文本挖掘等领域的学术研究,如分析高管薪酬与公司业绩的关系、基于文本信息的公司风险评估等。 行业应用:可以为金融分析师、投资机构提供数据支持,尤其是在公司估值、风险管理、投资决策等方面。 决策支持:支持公司管理层进行薪酬结构优化、治理模式改进等决策。 教育和培训:作为金融、会计、管理学等专业课程的辅助材料,帮助学生和研究人员深入理解公司财务、治理及相关文本信息。 此数据集特别适合用于探索高管薪酬与公司业绩、文本内容之间的关联性,帮助用户实现风险预警、投资策略优化等目标。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 30, 2025, 20:58 (UTC)
创建于 五月 30, 2025, 20:56 (UTC)