数据集概述
本数据集为植物标本相关的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless Data数据包格式组织,包含引用、归属、问题记录等九类文件,用于规范植物标本元数据中的人员关联信息。
文件详解
- 核心数据文件(压缩包格式)
citations.csv.zip:ZIP格式,可能包含标本相关引用文献信息
attributions.csv.zip:ZIP格式,可能包含采集者与鉴定者的归属关联数据
articles.csv.zip:ZIP格式,可能包含相关学术文章信息
problem_collector_dates.csv.zip:ZIP格式,可能包含采集者日期信息的问题记录
problem_determiner_dates.csv.zip:ZIP格式,可能包含鉴定者日期信息的问题记录
not_them_assertions.csv.zip:ZIP格式,可能包含非目标人员的排除声明数据
occurrences.csv.zip:ZIP格式,可能包含标本 occurrence 数据
users.csv.zip:ZIP格式,可能包含标注志愿者用户信息
- 数据包描述文件
datapackage.json:JSON格式,Frictionless Data数据包的元数据描述文件,包含数据集结构、字段定义等信息
数据来源
Bionomia平台(由志愿者标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)
适用场景
- 生物多样性元数据规范:用于标准化植物标本采集者与鉴定者的关联信息,提升标本数据质量
- 标本人员信息核查:通过问题记录文件分析采集者/鉴定者日期等信息的错误类型,优化数据清洗流程
- 生物标本学研究:辅助研究植物标本的采集历史、鉴定流程及相关人员网络
- 公民科学项目评估:分析志愿者标注的归属数据,评估Bionomia等平台的标注质量与效率