数据集概述
本数据集关联密歇根州立大学苔藓植物标本的采集者与鉴定者信息,由Bionomia志愿者基于全球生物多样性信息设施(GBIF)聚合的标本数据标注生成。数据以Frictionless数据包格式组织,包含九份文件,涵盖标本关联、引用、文章、归因等信息,为苔藓植物标本数据的溯源与分析提供支持。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:作为Frictionless数据包的描述文件,通常包含数据集元数据(如名称、来源、许可)、数据文件清单及各文件的字段定义等信息。
- 压缩数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含八类压缩数据文件,分别对应标本引用、相关文章、采集/鉴定者归因、排除断言、标本记录、采集者日期问题、鉴定者日期问题及用户信息等内容,解压后为CSV格式,具体字段需参考数据包描述文件。
数据来源
Bionomia平台(由志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的密歇根州立大学苔藓植物标本数据
适用场景
- 生物标本溯源研究:通过采集者与鉴定者关联数据,追溯苔藓植物标本的采集与鉴定过程。
- 生物多样性数据整合:将标本记录与关联信息整合,支持苔藓植物多样性分布分析。
- 标本数据质量评估:利用日期问题文件,识别并修正采集者、鉴定者信息中的日期错误。
- 公民科学贡献分析:通过用户信息文件,研究Bionomia志愿者对生物标本数据标注的贡献情况。