数据集概述
本数据集为CHAS鸟类学(Arctos)馆藏标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless Data数据包格式组织,包含标本关联信息、问题日期记录、用户信息等9个文件,支持生物标本数据的溯源与管理研究。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、文件清单及描述信息
- 关联数据文件(ZIP格式压缩包)
- 文件名称:citations.csv.zip、attributions.csv.zip、articles.csv.zip、occurrences.csv.zip、users.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:分别包含引用信息、归属标注、相关文献、标本记录、用户数据等关联内容
- 问题日期文件(ZIP格式压缩包)
- 文件名称:problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:记录鉴定者与采集者相关的日期问题数据
- 排除断言文件(ZIP格式压缩包)
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含排除特定关联的断言数据
数据来源
Bionomia平台(https://bionomia.net/dataset/16965647-4120-4e0b-aa57-1eeaf028606e)、全球生物多样性信息机构(https://gbif.org/dataset/16965647-4120-4e0b-aa57-1eeaf028606e)
适用场景
- 生物标本溯源研究: 分析鸟类标本采集者与鉴定者的关联信息,支持标本数据的来源追溯
- 生物多样性数据管理: 用于CHAS鸟类学标本数据的标准化整理与质量控制
- 志愿者标注数据研究: 探究Bionomia平台志愿者标注的生物标本关联数据特征
- 标本日期问题分析: 基于问题日期文件,研究采集与鉴定日期记录的常见问题及改进方向
- 生物信息学数据包应用: 作为Frictionless Data格式的案例,支持生物数据互操作性研究