数据集概述
本数据集包含哥伦比亚安蒂奥基亚大学河口与海洋标本馆(CEMUA)环节动物标本的采集者与鉴定者关联信息,由志愿者通过Bionomia平台基于GBIF聚合的标本数据生成,采用Frictionless Data数据包格式组织,共11个文件,支持生物标本元数据的关联分析与管理。
文件详解
- 核心数据文件(.zip格式,共10个)
- 文件名:citations.csv.zip、problem_determiner_dates.csv.zip、missing_attributions.csv.zip、occurrences.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、users.csv.zip、users_unresolved.csv.zip(共8个核心数据压缩包,含标本引用、鉴定日期问题、归属缺失、标本记录、归属信息、身份排除声明、用户信息等数据)
- 文件格式:ZIP(压缩包内为CSV格式)
- 字段映射:包含标本与采集者/鉴定者的关联字段、日期字段、归属状态字段、用户身份字段等(具体字段需解压后查看CSV内容)
- 数据包描述文件
- 文件名:datapackage.json
- 文件格式:JSON
- 字段映射:遵循Frictionless Data标准,包含数据集元数据(如名称、来源、文件列表、格式描述等)
数据来源
- 原始标本数据:Global Biodiversity Information Facility(GBIF,数据集ID:07f969d7-4a0e-4e75-8f65-cf8bbc6cf44c)
- 关联数据生成:Bionomia平台志愿者Scribes
适用场景
- 生物标本元数据关联分析:研究环节动物标本采集者与鉴定者的关联关系,完善标本溯源信息
- 生物多样性数据质量评估:通过problem_determiner_dates、missing_attributions等文件分析标本数据的质量问题
- 标本馆数据管理优化:为CEMUA标本馆的环节动物标本数据管理提供结构化关联数据支持
- 生物多样性开放数据应用:作为标准化Frictionless Data数据包,支持全球生物多样性信息平台的数据整合与共享