数据集概述
本数据集为美国国立自然历史博物馆(NMNH)现存标本记录中采集者与鉴定者的关联数据,由Bionomia平台志愿者整理,基于全球生物多样性信息设施(GBIF)聚合的标本数据构建,以Frictionless Data数据包格式呈现,包含9个文件,支持生物标本记录与相关人员信息的关联分析。
文件详解
- 数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,包含数据集元数据信息
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本记录相关引用数据
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本记录相关的文献文章数据
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本记录中采集者与鉴定者的归属关联数据
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:非相关人员的断言数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的记录数据
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据整理的用户信息数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的记录数据
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本记录的出现数据
数据来源
Bionomia平台(数据集ID:821cc27a-e3bb-4bc5-ac34-89ada245069d)、全球生物多样性信息设施(GBIF,数据集ID:821cc27a-e3bb-4bc5-ac34-89ada245069d)
适用场景
- 生物标本记录管理: 关联标本记录与采集者、鉴定者信息,优化标本数据管理体系
- 生物多样性研究: 基于标本记录与人员关联数据,分析物种采集与鉴定的时空分布特征
- 生物分类学研究: 利用采集者与鉴定者的关联信息,辅助物种分类与鉴定的历史溯源
- 数据质量评估: 通过问题日期数据,分析标本记录中时间信息的质量问题及改进方向
- 志愿者贡献分析: 基于用户数据,研究公众科学项目中志愿者对生物标本数据整理的贡献模式