数据集概述
本数据集为瑞典自然历史博物馆无脊椎动物模式标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息 facility 聚合的标本数据。数据以Frictionless数据包格式组织,包含9个文件,涵盖标本关联信息、用户数据、问题日期记录等内容,是研究生物标本采集与鉴定历史的结构化参考资料。
文件详解
- 数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless数据包的描述文件,包含数据集元信息、文件清单及数据结构定义
- 压缩文件
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关引用信息的压缩文件
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本采集者与鉴定者关联归属信息的压缩文件
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本 occurrence 数据的压缩文件
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:参与标注的志愿者用户信息的压缩文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者日期存在问题的标本记录的压缩文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:鉴定者日期存在问题的标本记录的压缩文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标注为“非该人员”的关联断言记录的压缩文件
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关文献文章信息的压缩文件
数据来源
Bionomia平台(志愿者标注),基于全球生物多样性信息 facility(GBIF)聚合的数据集(https://gbif.org/dataset/f2ec825d-145a-42fd-9bfe-a411a557bc47)
适用场景
- 生物标本采集历史研究: 分析无脊椎动物模式标本的采集者信息及采集时间分布
- 生物分类学研究: 基于鉴定者关联数据,探究物种鉴定的历史脉络与分类学演变
- 生物多样性数据质量评估: 利用问题日期记录,分析标本元数据的质量问题及改进方向
- 公民科学参与分析: 通过用户数据,研究志愿者在生物标本数据标注中的贡献模式
- 标本数据关联网络构建: 整合归属信息与 occurrence 数据,构建标本-人员-文献的关联网络