数据集概述
本数据集为CHAS爬行动物学标本数据与采集者、鉴定者的关联数据,由志愿者在Bionomia平台标注生成,原始标本数据来自GBIF聚合的数据集。数据以Frictionless Data包格式组织,包含引用、文献、属性、标本记录等九类压缩或JSON文件,用于生物多样性标本的采集者与鉴定者信息关联分析。
文件详解
- 数据文件包(Frictionless Data package)
- 核心描述文件:datapackage.json,JSON格式,为数据集的Frictionless Data包描述文件
- 压缩数据文件:共8个ZIP格式文件,包括:
- citations.csv.zip:引用数据
- articles.csv.zip:文献数据
- attributions.csv.zip:属性数据
- not_them_assertions.csv.zip:非关联声明数据
- occurrences.csv.zip:标本记录数据
- problem_determiner_dates.csv.zip:鉴定者日期问题数据
- users.csv.zip:用户数据
- problem_collector_dates.csv.zip:采集者日期问题数据
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号4f2d0b57-2862-4f0b-94c7-d78cc3c58a1d)及Bionomia平台志愿者标注
适用场景
- 生物多样性标本元数据完善:补充CHAS爬行动物学标本的采集者与鉴定者关联信息
- 标本采集历史研究:分析爬行动物学标本的采集者、鉴定者及时间关联
- 生物多样性数据质量评估:通过问题日期数据识别标本元数据中的时间记录问题
- 志愿者标注数据应用:研究Bionomia平台志愿者标注数据在标本数据关联中的价值