数据集概述
本数据集为Museo Botánico CORD-IMBIV的Rosales、Salviniales等7个植物分类群标本馆数据,包含标本与采集者、鉴定者的关联信息,由志愿者通过Bionomia平台基于GBIF聚合数据标注,以Frictionless Data包格式组织,共9个文件。
文件详解
- 归档文件(共8个.zip格式)
citations.csv.zip:引用相关数据
not_them_assertions.csv.zip:非相关主体断言数据
occurrences.csv.zip:标本 occurrence 数据
users.csv.zip:用户相关数据
attributions.csv.zip:归属信息数据
articles.csv.zip:文献相关数据
problem_collector_dates.csv.zip:采集者日期问题数据
problem_determiner_dates.csv.zip:鉴定者日期问题数据
- 数据描述文件
datapackage.json:JSON格式,为Frictionless Data包的描述文件,定义数据集元数据
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(原始聚合数据)
适用场景
- 植物标本馆数据管理:优化标本与采集者、鉴定者的关联记录,提升馆藏数据质量
- 生物多样性研究:支撑7个植物分类群的标本分布、采集历史等分析
- 分类学历史研究:通过采集者与鉴定者关联数据,探究分类学研究的历史脉络
- 数据质量评估:利用日期问题文件,识别并改进标本采集、鉴定日期记录的准确性