数据集概述
本数据集为“CeDoc de Biodiversitat Vegetal: BCN-Seeds”植物标本数据中采集者与鉴定者的关联数据,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless数据包格式组织,包含9个文件,用于记录植物标本相关人员的关联信息及问题标注。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集元信息
- 压缩数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别包含引用信息、文献信息、人员关联归属、非本人标注、鉴定者日期问题、标本记录、采集者日期问题、用户信息等结构化数据
数据来源
Bionomia平台(志愿者Scribes标注)、Global Biodiversity Information Facility(GBIF)数据集(编号7a4856d6-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本元数据标准化: 用于规范植物标本采集者、鉴定者信息的关联与标注
- 生物多样性数据质量控制: 分析标本日期标注问题(采集者/鉴定者日期),提升数据准确性
- 标本相关人员研究: 探究植物标本采集者、鉴定者的贡献与关联网络
- 生物多样性信息系统整合: 为GBIF等平台的标本数据提供人员关联补充信息