数据集概述
本数据集为论文“Ten new species of Amphidraus Simon, 1900 (Araneae: Salticidae: Euophryini) and three new combinations”关联的自然历史标本数据,包含标本采集者、鉴定者的关联信息,由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data包格式组织,共9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,包含数据集元数据
- 引用文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用信息
- 用户文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注数据的志愿者用户信息
- 鉴定者日期问题文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的记录
- 文章文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:关联的学术文章信息
- 采集者日期问题文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的记录
- 归属文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者、鉴定者的归属信息
- 排除断言文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:排除特定人员关联的断言记录
- occurrence文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本的 occurrence 信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(https://gbif.org/dataset/35a1e1dd-0f99-4c5d-8a1f-54363af967be),由Bionomia志愿者标注(https://bionomia.net/dataset/35a1e1dd-0f99-4c5d-8a1f-54363af967be)
适用场景
- 生物分类学研究:用于分析Amphidraus蜘蛛新种的标本采集者、鉴定者关联信息,支持分类学研究
- 标本数据质量评估:通过problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip分析标本日期数据的质量问题
- 生物多样性数据整合:基于GBIF聚合数据,整合标本的采集、鉴定关联信息,支持生物多样性研究
- 学术引用分析:利用citations.csv.zip、articles.csv.zip分析关联学术文章的引用情况
- 志愿者贡献研究:通过users.csv.zip分析Bionomia志愿者的标注贡献情况