数据集概述
本数据集包含SPSF - Herbário Dom Bento José Pickel标本馆馆藏标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,原始标本数据来自全球生物多样性信息机构(GBIF)聚合的数据集,采用Frictionless Data包格式组织,共包含9个文件。
文件详解
- 数据文件包核心配置文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的元数据配置文件,定义数据集的结构、文件清单及相关描述信息
- 关联数据压缩文件(共8个ZIP格式文件)
- 文件名称:citations.csv.zip、attributions.csv.zip、articles.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(压缩包内为CSV文件)
- 字段映射介绍:分别包含引用信息、归属信息、文章信息、用户信息、鉴定者日期问题记录、非本人声明记录、标本 occurrence 数据、采集者日期问题记录等关联数据
数据来源
Bionomia平台志愿者标注(基于GBIF聚合的SPSF标本馆数据集,GBIF数据集编号:16ed67e5-fd70-4fd4-85c3-70ea2da627fe)
适用场景
- 生物标本馆数据管理优化:用于完善SPSF标本馆馆藏标本的采集者、鉴定者元数据关联,提升标本数据完整性
- 生物多样性研究支撑:为植物标本的采集历史、分类鉴定溯源提供关联数据支持
- 志愿者标注数据质量分析:通过problem_determiner_dates、problem_collector_dates等文件分析标注数据的质量问题与改进方向
- 生物标本数据标准化研究:基于Frictionless Data包格式的标本关联数据,为生物标本数据标准化提供实践案例