数据集概述
本数据集包含巴西佩洛塔斯联邦大学PEL标本馆通过REFLORA虚拟标本馆收录的植物标本数据,主要关联标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息 facility(GBIF)聚合的标本数据整理而成,采用Frictionless Data数据包格式,共包含九份文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集的结构、字段定义等描述信息
- 关联数据文件(压缩包格式)
- 文件名称:citations.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、users.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本采集者与鉴定者的关联信息、引用数据、用户标注记录、标本事件记录,以及采集/鉴定日期异常数据等内容
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合数据集(数据集ID:f15facfb-b1da-4fdd-b4cb-94a850ee6b0b)
适用场景
- 生物标本采集网络分析:研究植物标本采集者与鉴定者的合作网络及贡献关系
- 标本数据质量控制:通过异常日期数据识别并修正标本采集/鉴定信息的错误
- 生物多样性研究支撑:为植物分类学、分布区研究提供标本采集者与鉴定者的关联背景
- 标本馆数据标准化:作为PEL标本馆数据关联整合的参考数据集,提升标本数据的完整性