数据集概述
本数据集为HST(Herbário Sérgio Tavares)标本馆的自然历史标本数据,包含与采集者和鉴定者的关联信息。数据由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data包格式组织,共9个文件。
文件详解
- 数据文件包
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集的元数据、文件清单及结构规范
- 压缩数据文件
- 文件名称:citations.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、attributions.csv.zip、users.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本采集者与鉴定者的关联信息、标注归属、问题日期记录、排除断言、标本 occurrence 数据、用户信息等结构化数据
数据来源
Bionomia平台(志愿者标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)数据集(编号b3769e61-c3d0-4046-81cf-bf4d6b23b444)
适用场景
- 生物标本元数据标准化:用于HST标本馆采集者与鉴定者信息的规范化整理与关联分析
- 生物多样性数据溯源:通过采集者、鉴定者关联信息追溯标本数据的来源与可靠性
- 标本馆数据管理优化:辅助HST标本馆完善标本记录中的人员信息关联
- 志愿者标注数据研究:分析Bionomia平台志愿者对生物标本元数据的标注模式与质量