数据集概述
本数据集为美因茨自然历史博物馆动物学收藏的生物标本数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织。
文件详解
- 数据文件包配置文件:
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的配置文件,包含数据集元数据信息
- 压缩数据文件:
- 文件名称:citations.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:引用相关数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:鉴定者日期问题数据
- 文件名称:occurrences.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:标本 occurrence 数据
- 文件名称:articles.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:文章相关数据
- 文件名称:attributions.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:归因信息数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:采集者日期问题数据
- 文件名称:users.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:用户相关数据
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV压缩包
- 字段映射介绍:非本人声明数据
数据来源
Bionomia平台(志愿者标注)、全球生物多样性信息设施(GBIF)聚合数据集
适用场景
- 生物标本采集者与鉴定者信息管理: 用于整理和管理美因茨自然历史博物馆动物学标本的采集者与鉴定者关联数据
- 生物多样性标本数据标准化: 基于Frictionless Data数据包格式,推动生物标本数据的标准化处理
- 标本数据质量控制: 利用日期问题数据(problem_determiner_dates、problem_collector_dates)优化标本数据质量
- 生物标本数据引用分析: 通过citations.csv.zip文件分析标本数据的引用情况
- 生物多样性数据归因研究: 基于attributions.csv.zip文件开展生物标本数据的归因研究