数据集概述
本数据集为纳瓦拉大学PAMP维管植物标本馆的自然历史标本数据,包含与标本采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,共含9个文件。
文件详解
- 数据文件组(archive_files):共8个ZIP格式文件
citations.csv.zip:CSV格式压缩文件,可能包含标本相关引用信息
problem_collector_dates.csv.zip:CSV格式压缩文件,可能包含采集者日期相关问题记录
problem_determiner_dates.csv.zip:CSV格式压缩文件,可能包含鉴定者日期相关问题记录
users.csv.zip:CSV格式压缩文件,可能包含数据标注用户信息
attributions.csv.zip:CSV格式压缩文件,可能包含数据归属与标注信息
articles.csv.zip:CSV格式压缩文件,可能包含相关文献文章信息
occurrences.csv.zip:CSV格式压缩文件,可能包含标本 occurrence 核心数据
not_them_assertions.csv.zip:CSV格式压缩文件,可能包含非目标对象的声明记录
- 数据包描述文件(data_files)
datapackage.json:JSON格式文件,为Frictionless Data数据包的描述文件,定义数据集元数据、文件结构及字段等信息
数据来源
Bionomia平台(数据集ID:d7c78847-d662-44c4-a550-5a812dbcc71b),原始标本数据来自Global Biodiversity Information Facility(GBIF,数据集ID:d7c78847-d662-44c4-a550-5a812dbcc71b)
适用场景
- 生物标本馆数据管理:用于纳瓦拉大学PAMP维管植物标本馆采集者、鉴定者与标本的关联管理与查询
- 生物多样性研究:分析维管植物标本的采集者、鉴定者分布及标本记录特征
- 数据质量评估:基于问题日期文件,评估标本采集与鉴定日期数据的质量问题
- 公民科学数据应用:研究Bionomia平台志愿者标注的生物标本关联数据的应用价值
- 标本数据标准化:参考Frictionless Data数据包格式,推动植物标本数据的标准化组织