数据集概述
本数据集为加州伯克利Sagehen Creek野外站昆虫标本的采集者与鉴定人关联数据,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据,以Frictionless Data数据包格式组织,包含九份文件,用于呈现昆虫标本与相关人员的关联信息及问题记录。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集整体信息
- 引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本相关的引用信息
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录被排除的采集者/鉴定人关联断言
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者相关日期存在问题的标本信息
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标注志愿者等用户信息
- 归属信息文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录标本与采集者/鉴定人的归属关联信息
- 鉴定人日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录鉴定人相关日期存在问题的标本信息
- 发生记录文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含昆虫标本的发生记录信息
- 文献文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含与标本相关的文献信息
数据来源
Bionomia平台(由志愿者Scribes标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)数据集(编号:1b81302b-b935-4493-8ff8-9a47797d68c1)
适用场景
- 生物标本数据管理优化:分析采集者/鉴定人关联信息的准确性,优化标本元数据质量
- 生物多样性研究:通过标本与人员的关联数据,追溯昆虫标本的采集背景与鉴定过程
- 公民科学贡献分析:研究Bionomia志愿者标注的归属信息对生物标本数据的补充价值
- 标本时间信息校验:利用日期问题文件,校验采集与鉴定日期的合理性,完善标本时间维度数据