数据集概述
本数据集为国家博物馆昆虫标本馆藏关联的采集者与鉴定者数据,由志愿者通过Bionomia平台基于全球生物多样性信息设施(GBIF)聚合的标本数据生成,包含标本与人员的关联声明及属性信息,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,通常包含数据集元信息、资源列表及各文件的结构定义(如字段名称、类型等)
- 压缩数据文件
- 文件名称:
citations.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、attributions.csv.zip、users.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含8类压缩CSV文件,推测内容分别为:文献引用数据、采集者日期问题数据、鉴定者日期问题数据、相关文献数据、非关联声明数据、标本记录数据、属性关联数据、用户信息数据
数据来源
Bionomia平台(基于Global Biodiversity Information Facility聚合的标本数据)
适用场景
- 生物标本元数据研究:分析国家博物馆昆虫标本的采集者、鉴定者关联信息及数据质量问题
- 生物多样性数据整合:为全球生物多样性信息设施(GBIF)的标本数据提供人员关联补充
- 昆虫分类学历史研究:通过采集者、鉴定者信息追溯昆虫标本的采集背景与分类学历史
- 公民科学数据应用:研究志愿者通过Bionomia平台参与生物标本数据标注的模式与成果