数据集概述
本数据集为UAM昆虫标本馆(Arctos系统)内昆虫标本的采集者与鉴定者关联数据,由Bionomia平台志愿者基于全球生物多样性信息设施(GBIF)聚合的标本数据标注生成,包含标本记录、人员关联及问题数据等内容,采用Frictionless Data数据包格式组织。
文件详解
- 数据文件
- 文件名称:occurrences.csv.zip、citations.csv.zip、articles.csv.zip、users.csv.zip、attributions.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:包含昆虫标本记录、文献引用、相关文章、用户信息及采集者/鉴定者关联归因等核心数据字段
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:记录采集者日期问题、鉴定者日期问题及非关联人员声明等异常数据字段
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准的数据包元数据描述,包含数据集结构、文件清单及格式定义等信息
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF,数据聚合来源)、UAM Insect Collection (Arctos)
适用场景
- 生物标本元数据分析:用于研究UAM昆虫标本馆的采集者、鉴定者网络及标本记录关联关系
- 生物多样性数据质量评估:通过问题数据文件分析标本元数据中的日期错误、人员关联异常等质量问题
- 自然历史标本馆管理优化:为标本馆的采集者/鉴定者信息标准化与关联管理提供数据支持
- 生物多样性开放数据研究:作为Frictionless Data格式的案例,探索生物多样性数据的标准化共享模式