数据集概述
本数据集为论文《On the taxonomy of Negeta semialba Hampson, 1918 with descriptions of two new Leucobaeta species》关联的自然历史标本数据,包含标本采集者、鉴定者的关联信息,由Bionomia志愿者整理GBIF聚合数据生成,以Frictionless Data包格式存储,共9个文件。
文件详解
- 数据文件包配置
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的配置文件,定义数据集元数据
- 标本记录文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本 occurrence 核心记录数据
- 采集者与鉴定者关联文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者、鉴定者的关联归属信息
- 文献引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:相关文献引用数据
- 论文信息文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:关联论文的元数据信息
- 用户信息文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据整理的用户信息
- 采集日期问题记录文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集日期存在问题的标本记录
- 鉴定日期问题记录文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定日期存在问题的标本记录
- 排除标本记录文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:明确排除关联的标本记录
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:c5d88522-2e5e-4b92-8c64-4b4b03691cac),由Bionomia志愿者整理
适用场景
- 昆虫分类学研究:支持Negeta semialba及Leucobaeta新种的分类学验证与标本溯源
- 生物标本数据标准化:分析标本采集者、鉴定者关联数据的标准化方法
- 生物多样性数据整合:作为GBIF聚合数据的补充,完善鳞翅目昆虫标本元数据
- 分类学文献关联研究:探索分类学论文与标本数据的关联机制
- 标本时间数据质量评估:利用日期问题记录分析生物标本时间数据的常见质量问题