数据集概述
本数据集为中国PE标本馆1950-1999年50万份植物标本的采集人员与鉴定人员关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,支持植物标本采集鉴定人员信息的关联查询与分析。
文件详解
- 核心数据文件(共8个ZIP压缩包)
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、users.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:分别存储标本引用、文献、人员归属、采集日期问题记录、鉴定日期问题记录、非本人标注声明、标本 occurrence 信息、平台用户数据等关联内容
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,包含数据集元数据、文件清单及格式描述
数据来源
Bionomia平台(基于Global Biodiversity Information Facility聚合的PE标本馆数据)
适用场景
- 植物标本采集历史研究:分析1950-1999年PE标本馆植物标本采集人员的活动规律与区域分布
- 分类学鉴定人员网络分析:关联鉴定人员信息,研究植物分类学领域的人员合作网络
- 标本数据质量校验:利用日期问题记录文件,优化植物标本采集、鉴定日期的标准化处理
- 生物多样性数据关联应用:将采集鉴定人员信息与标本 occurrence 数据结合,支撑生物多样性历史数据的深度挖掘