数据集概述
本数据集关联了论文《Twelve new species of Priceiella》中涉及的自然历史标本的采集者与鉴定者信息,包含标本记录、引用、用户归因等结构化数据,由Bionomia志愿者标注,基于GBIF聚合的标本数据集整理,以Frictionless Data包格式呈现,共9个文件。
文件详解
- 数据文件包配置
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的配置文件,定义数据集元数据及各数据文件的结构描述
- 标本核心数据
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含Priceiella物种标本的核心记录信息
- 引用数据
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本相关的文献引用信息
- 用户信息
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的Bionomia志愿者用户数据
- 归因数据
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者与鉴定者的归因关联记录
- 文献数据
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:涉及的学术文献信息
- 排除断言数据
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为非目标关联的断言记录
- 鉴定者日期问题数据
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:存在日期问题的鉴定者关联记录
- 采集者日期问题数据
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:存在日期问题的采集者关联记录
数据来源
Bionomia平台(数据集ID:3eba6a5a-6f4b-4e46-be4e-d01b5f7b866d),基于Global Biodiversity Information Facility(GBIF)聚合的标本数据集
适用场景
- 生物分类学研究:支撑Priceiella属新物种的分类学验证与标本溯源
- 生物多样性数据整合:关联标本采集者、鉴定者信息,完善物种数据链条
- 标本数据质量评估:利用日期问题数据优化标本元数据准确性
- 志愿者贡献研究:分析Bionomia平台志愿者对生物标本数据标注的贡献模式
- 文献与标本关联分析:探索昆虫分类学文献与标本记录的对应关系