数据集概述
本数据集包含俾路支斯坦大学标本馆标本数据与采集者、鉴定者的关联信息,由志愿者通过Bionomia平台基于全球生物多样性信息机构(GBIF)聚合的标本数据生成,采用Frictionless Data数据包格式,含9个文件,涵盖关联属性、引用、问题记录等内容。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集基本信息、文件清单及格式描述
- 关联属性文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本数据与采集者、鉴定者的关联属性信息
- 引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用信息
- 文献文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本关联的文献信息
- 标本记录文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本的核心记录信息
- 用户文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与关联工作的用户信息
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期相关的问题记录
- 鉴定者日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期相关的问题记录
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:关于排除特定关联的断言信息
数据来源
Bionomia平台(志愿者通过https://bionomia.net/dataset/a1480b53-ae89-4997-ab2a-73b3981ca244生成),原始标本数据来自Global Biodiversity Information Facility(https://gbif.org/dataset/a1480b53-ae89-4997-ab2a-73b3981ca244)
适用场景
- 生物标本馆数据管理: 用于完善俾路支斯坦大学标本馆标本的采集者、鉴定者关联信息
- 生物多样性研究: 支持基于标本采集者、鉴定者维度的生物多样性分析
- 数据质量控制: 利用问题记录文件优化标本元数据的准确性
- 志愿者贡献研究: 分析Bionomia平台志愿者在标本数据关联中的贡献模式
- 标本引用分析: 通过引用文件研究标本在文献中的使用情况