数据集概述
本数据集包含与CardObs自然观察工具相关的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由志愿者在Bionomia平台标注,基于GBIF聚合的CardObs数据集生成,以Frictionless Data包格式组织,包含9个文件,支持生物多样性相关的标本信息分析。
文件详解
- 压缩文件(ZIP格式)
- 文件名称:citations.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、attributions.csv.zip、occurrences.csv.zip、users.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:包含采集者与鉴定者关联的核心数据,涉及引用信息、日期问题记录、断言信息、文章数据、归属信息、标本出现记录、用户数据等;
- 数据描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集的元数据、文件结构及数据规范。
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:905f00be-866c-4c60-920a-3056349df52e)
适用场景
- 生物多样性标本溯源:分析自然历史标本的采集者与鉴定者关联信息,追溯标本的采集背景;
- 标本数据质量评估:通过problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip等文件,识别标本日期相关的数据质量问题;
- 志愿者标注行为研究:基于users.csv.zip和attributions.csv.zip,研究Bionomia平台志愿者的标本信息标注行为;
- 生物多样性数据整合:利用datapackage.json的规范描述,支持与其他生物多样性数据集的整合分析。