上市公司高管薪酬与文本分析数据集ExecutiveCompensationandTextAnalysisDataset-lemonlulu
数据来源:互联网公开数据
标签:高管薪酬, SEC文件, 文本分析, 公司治理, 财务分析, 合同类型, 机器学习, 企业管理
数据概述:
该数据集包含来自美国证券交易委员会(SEC)披露的上市公司文件,记录了上市公司高管薪酬相关信息以及对应的文本内容,适用于公司治理、财务分析和文本挖掘等领域的研究。主要特征如下:
时间跨度:数据记录的时间范围覆盖多个年份,具体年份信息包含在数据集内,可根据“fyear”字段进行筛选。
地理范围:数据主要来源于美国上市公司,通过SEC文件进行披露。
数据维度:数据集包含多个CSV文件,主要字段包括:公司识别码(cik)、财年(fyear)、文件名称(file)、公告年份(ann_year)、数据日期(datadate)、公司股票代码(gvkey)、管理层讨论与分析文本(cda_text)、错误信息(error)、原始数据(raw_data)、合同类型(contract_type)、维度信息(dimension)、细节信息(details)、指标(metrics)以及分析结果(analysis_result)。
数据格式:数据以CSV格式提供,包含多个文件,如employee.csv、all_clean_1_part1.csv等,便于数据分析和处理。其中,cda_text字段包含管理层讨论与分析文本,可用于文本分析。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于公司治理、高管薪酬、文本挖掘等领域的学术研究,如分析高管薪酬与公司业绩的关系、基于文本信息的公司风险评估等。
行业应用:可以为金融分析师、投资机构提供数据支持,尤其是在公司估值、风险管理、投资决策等方面。
决策支持:支持公司管理层进行薪酬结构优化、治理模式改进等决策。
教育和培训:作为金融、会计、管理学等专业课程的辅助材料,帮助学生和研究人员深入理解公司财务、治理及相关文本信息。
此数据集特别适合用于探索高管薪酬与公司业绩、文本内容之间的关联性,帮助用户实现风险预警、投资策略优化等目标。