数据集概述
本数据集为CBNA标本馆标本关联采集者与鉴定者的生物多样性数据,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless数据包格式组织,包含9个文件,主要记录标本与采集者、鉴定者的关联信息及相关问题数据。
文件详解
- 核心数据文件
- 文件名称:citations.csv.zip、attributions.csv.zip、users.csv.zip、articles.csv.zip、occurrences.csv.zip
- 文件格式:CSV压缩包(.zip)
- 字段映射介绍:包含标本与采集者/鉴定者的引用、归属关系数据,用户信息,相关文献及标本 occurrence 基础信息
- 问题数据文件
- 文件名称:problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV压缩包(.zip)
- 字段映射介绍:记录鉴定者日期问题、采集者日期问题及非本人标注的断言数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据描述文件,定义数据集结构与属性
数据来源
Global Biodiversity Information Facility(GBIF)数据集(ID:e08f0546-0224-4b0d-886d-4ab05f0c87e6),由Bionomia志愿者标注生成
适用场景
- 生物标本采集历史研究: 分析CBNA标本馆标本的采集者、鉴定者关联信息,还原标本采集历史脉络
- 生物多样性数据质量优化: 基于问题数据文件,识别并修正标本采集/鉴定日期的错误记录
- 标本馆数据关联分析: 整合标本 occurrence 数据与人员关联信息,支撑生物多样性大数据研究
- 公民科学贡献评估: 分析Bionomia志愿者标注的归属数据,评估公民科学对生物标本数据的补充价值