二氧化碳排放标注的黄金标准与标注数据集

数据集概述

本数据集是用于从企业年度及可持续发展报告中提取温室气体排放数据的基准数据集,包含黄金标准数据集与标注数据集,涵盖三个阶段的标注结果,为相关研究提供标准化数据支持。

文件详解

  • 数据文件:
  • codebook_gold_standard.csv:CSV格式,字段包括company_name(企业名称,字符串,如Daimler)、report_year(报告年份,整数,范围2017-2022)等,描述黄金标准数据集的变量信息。
  • codebook_annotation_dataset.csv:CSV格式,字段包括company_name(企业名称,字符串,如Allianz)、report_year(报告年份,整数,范围2017-2022)等,描述标注数据集的变量信息。
  • datasets.zip:压缩文件,包含gold_standard和annotation_dataset两个数据集,需密码解压。
  • 文档文件:
  • Expert Annotation Guidelines.pdf:PDF格式,专家标注指南文档。
  • Non-Expert Annotation Guidelines.pdf:PDF格式,非专家标注指南文档。

适用场景

  • 自然语言处理研究:用于训练和评估从企业报告中提取温室气体排放数据的模型。
  • 企业可持续发展分析:辅助分析企业碳排放数据的准确性与合规性。
  • 基准数据集构建:为碳排放数据标注任务提供标准化的评估基准。
  • 气候政策研究:支持基于企业碳排放数据的政策效果分析。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.53 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。