数据集概述
本数据集为南卡希亚斯大学标本馆(HUCS)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,采用Frictionless Data数据包格式,包含9个文件。
文件详解
- 压缩文件(ZIP格式,共8个)
- 文件名称:citations.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP
- 字段映射介绍:各压缩包内包含CSV文件,分别对应标本引用、标本记录、相关文献、属性标注、排除声明、采集者日期问题记录、鉴定者日期问题记录及用户信息等数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,包含数据集的元数据信息,如文件清单、数据结构定义等
数据来源
HUCS - Herbário da Universidade de Caxias do Sul,由Bionomia志愿者标注,基于GBIF聚合数据(数据集ID:52b78a58-c84a-4370-bb14-b27a007d5da6)
适用场景
- 生物标本数据管理:用于HUCS标本馆标本采集者与鉴定者信息的关联整合与标准化管理
- 生物多样性研究:通过标本记录与人员关联数据,分析物种采集与鉴定的历史脉络
- 标本数据质量控制:利用日期问题记录文件,优化标本采集、鉴定日期的准确性校验
- 志愿者贡献分析:通过用户信息文件,研究Bionomia平台志愿者对标本数据标注的贡献情况