数据集概述
本数据集为美国史密森尼学会标本馆中巴西归还标本的采集者与鉴定者关联数据,关联至REFLORA虚拟标本馆,由Bionomia志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集的结构、模式等描述信息
- 压缩数据文件
- 文件名称:
citations.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本采集者与鉴定者的关联属性数据,具体字段需解压后查看CSV内容,推测涵盖引用、标注声明、日期问题记录、用户信息、标本 occurrence 数据等关联信息
数据来源
Bionomia平台(由志愿者Scribes标注),基于全球生物多样性信息设施(GBIF)数据集(编号:3cb7fc60-aa95-4556-b987-b7f6f593b9a1)
适用场景
- 生物标本数据关联分析:研究标本采集者与鉴定者的关联关系,完善标本元数据
- 生物多样性信息管理:补充标本馆数据的采集与鉴定主体信息,提升数据完整性
- 标本数据质量控制:通过日期问题文件分析标本采集或鉴定日期的异常情况
- 生物标本馆数据整合:支持REFLORA虚拟标本馆与史密森尼学会标本数据的关联整合
- 志愿者标注数据研究:分析Bionomia平台志愿者标注的标本关联数据特征与应用价值