数据集概述
该数据集包含2009-2020年间与可持续发展目标(SDG)各目标相关的140万篇研究文献DOI标签数据,通过Scopus平台使用Aurora SDG查询版本5获取,覆盖SDG目标层级分类,支持文献与SDG目标的关联分析。
文件详解
- 主数据文件(CSV格式):
- aurora_sdg_v5_worldwide_set_doi_sdg_targets_2009-2020.csv:包含140万行数据,4个核心字段(doi、date、sdg_target、sdg_goal)
- aurora_sdg_v5_worldwide_set_doi_sdg_targets_2009-2020-in-columns.csv:包含140万行数据,180个字段(doi、date、169个sdg_targets列、17个sdg_goals列)
- 样本数据文件(CSV格式):
- SAMPLE_aurora_sdg_v5_worldwide_set_doi_abstracts_sdg_targets_2009-2020.csv:样本数据,包含eid、doi、sdg_target、sdg_goal、date、title、abstract_cleaned字段
- SAMPLE_aurora_sdg_v5_worldwide_set_doi_abstracts_sdg_targets_2009-2020-in-columns.csv:样本数据,包含eid、doi、date、title、abstract_cleaned及各SDG目标/目标列
- Excel数据文件:
- aurora_sdg_v5_worldwide_set_doi_sdg_targets_2009-2020.xlsx:与主CSV文件内容一致的Excel格式文件
- 辅助文件:
- data-preparation-steps.png:数据准备步骤相关图片
数据来源
Scopus
适用场景
- 文献SDG目标匹配:快速关联已有文献列表与SDG目标分类
- 文本分类模型训练:作为种子数据集训练SDG相关文本/图分类器
- 可持续发展研究趋势分析:统计不同时期各SDG目标相关文献分布
- 学术影响力评估:分析SDG领域高产出机构或作者的研究方向
- 开放科学资源整合:结合CrossRef、Unpaywall等平台提取文献全文信息进行深度分析