数据集概述
本数据集为Biofokus相关的自然历史标本数据,包含标本与采集者、鉴定者的关联信息,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件(.zip格式,共8个)
- citations.csv.zip:标本引用信息文件
- problem_determiner_dates.csv.zip:鉴定者日期问题记录文件
- users.csv.zip:标注志愿者用户信息文件
- occurrences.csv.zip:标本出现记录文件
- attributions.csv.zip:采集者/鉴定者关联归因记录文件
- articles.csv.zip:相关文献记录文件
- not_them_assertions.csv.zip:非目标人员断言记录文件
- problem_collector_dates.csv.zip:采集者日期问题记录文件
- 数据包描述文件
- datapackage.json:Frictionless Data数据包的元数据描述文件,定义数据集结构与属性
数据来源
Bionomia平台(由志愿者Scribes标注),原始标本数据来自Global Biodiversity Information Facility(GBIF)数据集(编号2e4cc37b-302e-4f1b-bbbb-1f674ff90e14)
适用场景
- 生物多样性标本数据管理:整合标本与采集者、鉴定者的关联信息,完善标本元数据
- 自然历史研究:分析标本采集者、鉴定者的工作分布与贡献
- 数据质量评估:通过问题日期文件识别标本记录中的时间信息错误
- 志愿者参与研究:基于用户文件分析Bionomia平台志愿者的标注行为与贡献