数据集概述
本数据集为卡尔达斯大学昆虫实验室(LEUC)昆虫标本的采集者与鉴定者关联数据,包含志愿者通过Bionomia平台基于GBIF聚合数据生成的归属声明。数据以Frictionless Data包格式组织,涵盖标本关联、文献引用、问题日期记录等9个文件,用于昆虫标本元数据的关联分析与质量控制。
文件详解
- 核心数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,包含数据集元数据及各数据文件的结构定义
- 压缩数据文件
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、attributions.csv.zip、occurrences.csv.zip、users.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:分别包含文献引用记录、非归属声明、鉴定者日期问题记录、关联文献、标本归属声明、标本 occurrence 数据、用户信息、采集者日期问题记录等结构化数据
数据来源
Global Biodiversity Information Facility(GBIF)聚合数据集(编号d0996e5a-6ae2-46e2-94ca-1b6a3ce1f3d4);Bionomia平台志愿者Scribes贡献
适用场景
- 生物标本元数据分析:研究LEUC昆虫标本的采集者、鉴定者关联关系及数据完整性
- 标本数据质量控制:通过问题日期记录文件识别并修正采集/鉴定日期的异常数据
- 生物多样性研究:整合标本 occurrence 数据与文献引用,支持昆虫分类学及分布研究
- 公民科学贡献评估:分析Bionomia平台志愿者对标本数据关联的贡献模式与质量