数据集概述
本数据集为新热带区栉足蛛科Guasuctenus新属蜘蛛的标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息 facility(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,支持生物分类学研究中标本信息的追溯与验证。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、字段、格式等描述信息。
- 压缩数据文件(共8个)
- 文件名称:citations.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本引用、文献、归属信息、否定断言、标本 occurrence 记录、用户信息,以及采集者/鉴定者日期问题数据等结构化内容,具体字段需解压后查看CSV文件定义。
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号d2dda052-5654-4b34-bf72-b6d557300f7e),经Bionomia平台志愿者标注生成
适用场景
- 生物分类学研究: 用于Guasuctenus新属蜘蛛的标本采集与鉴定信息追溯,支持分类地位验证。
- 标本数据标准化分析: 基于Frictionless Data格式,研究生物标本数据的标准化存储与关联方法。
- 生物多样性数据整合: 关联GBIF与Bionomia数据,分析新属蜘蛛的分布与采集历史。
- 标本元数据质量评估: 通过problem_collector_dates/problem_determiner_dates文件,评估标本日期信息的质量问题。