数据集概述
该数据集为2022年12月开放资产级数据的汇编,包含全球供应链相关场地位置信息,整合9个公开数据源,经清洗和协调后形成189,075个数据点,覆盖纺织服装、医疗健康、能源等多个行业,各行业数据覆盖度存在差异。
文件详解
该数据集包含3个文件,具体说明如下:
- Documentation Compilation of open asset-level data Dec 2022.pdf:PDF格式文档,可能包含数据集的详细说明、处理方法或使用指南
- assets_cleaned.csv:CSV格式数据文件,核心字段包括id(资产唯一标识)、id_original(原始来源标识)、source(数据来源)、site_name(场地名称)、company(所属公司)、industry(所属行业)、country(国家)、longitude(经度)、latitude(纬度)等
- assets_cleaned.rds:R语言数据文件,内容与assets_cleaned.csv一致,为R环境优化的存储格式
数据来源
- Open Supply Hub(原Open Apparel Registry)
- Global Power Plant Database
- Climate trace
- FDA database
- Global Dam Watch
- EudraGMDP database
- Sustainable Finance Initiative GeoAsset Databases
- Global Tailings Portal
- Fine print Mining Database
适用场景
- 供应链透明度研究:分析不同行业全球供应链场地的分布特征
- 产业地理分布分析:探究各行业资产在国家及区域层面的布局规律
- 环境与可持续发展研究:结合资产位置数据评估行业环境影响
- 数据整合方法论探索:研究多源开放资产数据的清洗与协调技术
- 行业数据覆盖度评估:识别各行业开放资产数据的完整性差异