数据集概述
本数据集为卡内基无脊椎动物学馆藏的生物标本数据,包含与标本采集者、鉴定者的关联信息。数据由志愿者在Bionomia平台基于全球生物多样性信息机构(GBIF)聚合的标本数据生成,采用Frictionless Data数据包格式组织,共包含9个文件,支持生物标本元数据的关联分析。
文件详解
- 数据文件包(Frictionless Data package)
- 核心描述文件:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,定义数据集的结构、字段、格式等核心信息
- 压缩数据文件:共8个ZIP格式文件,包括:
- citations.csv.zip:引文数据
- occurrences.csv.zip:标本 occurrence 数据
- users.csv.zip:用户数据
- not_them_assertions.csv.zip:非本人断言数据
- problem_collector_dates.csv.zip:采集者日期问题数据
- problem_determiner_dates.csv.zip:鉴定者日期问题数据
- attributions.csv.zip:归属数据
- articles.csv.zip:文章数据
数据来源
Bionomia平台(基于Global Biodiversity Information Facility聚合的标本数据,数据集ID:5788015d-be84-4fcd-8fc5-e77063b4479d)
适用场景
- 生物标本元数据关联分析: 研究卡内基无脊椎动物学馆藏标本与采集者、鉴定者的关联关系
- 生物多样性数据标准化研究: 基于Frictionless Data格式分析标本数据的标准化组织方式
- 标本采集历史考证: 利用采集者、鉴定者关联数据及日期问题数据,考证标本的采集背景
- 生物标本数据质量评估: 通过问题日期数据等,分析标本元数据的质量问题及改进方向
- 生物多样性开放数据整合: 结合GBIF聚合数据,探索跨平台生物多样性数据的整合方法