数据集概述
本数据集为亚马逊国家研究所(INPA)倍足纲标本库的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式组织,共含九个文件。
文件详解
- 数据文件包(Frictionless Data package)
- 描述文件:datapackage.json,JSON格式,为Frictionless Data数据包的描述文件
- 压缩数据文件:共8个ZIP格式文件,包括citations.csv.zip、users.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、attributions.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip,分别对应引用、用户、标本记录、非关联声明、鉴定者日期问题、归属信息、文献、采集者日期问题等数据内容
数据来源
Instituto Nacional de Pesquisas da Amazônia (INPA) Diplopoda Collection,由Bionomia志愿者标注,基于GBIF聚合数据集(https://gbif.org/dataset/6834c3b4-50a7-42df-a87f-324239eaca66)
适用场景
- 生物标本数据管理: 用于整理和关联倍足纲标本的采集者、鉴定者信息,完善标本元数据
- 生物多样性研究: 分析亚马逊地区倍足纲物种的采集历史、鉴定人员网络及标本分布
- 科研人员协作网络分析: 通过采集者与鉴定者关联数据,研究生物分类学领域的科研协作模式
- 标本数据质量控制: 利用日期问题数据文件,识别和修正标本采集、鉴定日期的错误记录