数据集概述
本数据集为Butler University持有的自然历史标本数据,关联了标本对应的采集者与鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集生成,采用Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、occurrences.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(压缩包内为CSV格式)
- 字段映射介绍:分别包含标本引用、非关联声明、采集者/鉴定者归属、鉴定者日期问题、用户信息、标本记录、相关文献、采集者日期问题等结构化数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据文件,包含数据集基本信息、文件清单及结构定义
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(标本数据来源)
适用场景
- 生物标本采集者/鉴定者网络分析: 基于关联数据研究标本背后科研人员的合作网络与贡献
- 自然历史标本溯源: 通过采集者/鉴定者信息追溯标本的采集背景与鉴定过程
- 生物多样性数据质量评估: 利用日期问题文件分析标本元数据中的时间信息准确性
- 标本文献关联研究: 通过citations和articles文件链接标本数据与相关学术文献
- 公民科学贡献分析: 基于users.csv.zip数据研究Bionomia志愿者的标注行为与贡献模式