数据集概述
本数据集为内布拉斯加大学州立博物馆鸟类标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless Data包格式组织,包含9个文件,用于记录标本与相关人员的关联信息及数据问题记录。
文件详解
- 数据文件包配置
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的配置文件,定义数据集的元数据、文件清单及结构规范
- 关联数据文件(压缩包格式)
- 文件名称:
citations.csv.zip、attributions.csv.zip、occurrences.csv.zip、articles.csv.zip、users.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:分别记录标本引用信息、人员关联归属、标本 occurrence 数据、相关文献文章及标注用户信息
- 问题记录文件(压缩包格式)
- 文件名称:
problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:分别记录鉴定者日期问题、采集者日期问题及非关联人员的断言记录
数据来源
Bionomia平台(由志愿者Scribes标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)聚合的University of Nebraska State Museum Birds Collection数据集
适用场景
- 生物标本管理研究:分析鸟类标本采集者与鉴定者的关联关系,优化标本数据管理流程
- 生物多样性数据质量评估:通过问题记录文件识别标本数据中的日期错误等质量问题
- 自然历史研究:结合标本 occurrence 数据与人员关联信息,追溯鸟类标本的采集历史与鉴定背景
- 志愿者参与式数据标注研究:分析Bionomia平台志愿者对生物标本数据的标注行为与贡献模式