数据集概述
本数据集为HUCS-Micoteca(南卡希亚斯大学植物标本馆标本库)的生物标本数据,包含与标本采集者和鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,采用Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 核心数据文件(压缩包格式)
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:包含标本采集者、鉴定者的关联信息、引用文献、归属声明、标本记录、日期问题记录及用户信息等结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,描述数据集的元数据信息,包括文件清单、数据结构定义等
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF,数据集ID:435a8964-e58a-488c-8c93-1fd62eab13cc)
适用场景
- 生物标本数据管理: 用于HUCS-Micoteca标本馆的采集者、鉴定者信息关联与标准化管理
- 生物多样性研究: 分析标本采集者、鉴定者的活动轨迹及标本记录的时间、空间分布特征
- 标本数据质量控制: 基于problem_collector_dates.csv.zip和problem_determiner_dates.csv.zip识别并修正日期相关的标本数据错误
- 科学贡献归因研究: 通过attributions.csv.zip分析志愿者对生物标本数据标注的贡献情况