数据集概述
本数据集为TB Lee植物标本馆维管植物收藏第二阶段的标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,用于生物多样性标本数据的关联分析。
文件详解
- 压缩文件(共8个,格式为.zip)
- citations.csv.zip:标本引用信息相关数据压缩包
- attributions.csv.zip:标本归属信息相关数据压缩包
- not_them_assertions.csv.zip:非本人标注声明相关数据压缩包
- articles.csv.zip:相关文献文章信息压缩包
- users.csv.zip:参与标注的用户信息压缩包
- occurrences.csv.zip:标本出现记录相关数据压缩包
- problem_determiner_dates.csv.zip:鉴定者日期问题数据压缩包
- problem_collector_dates.csv.zip:采集者日期问题数据压缩包
- 配置文件
- datapackage.json:Frictionless Data数据包的配置文件,格式为.json,用于描述数据集的元数据信息
数据来源
Bionomia平台(由志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的标本数据
适用场景
- 生物多样性标本数据关联分析:用于分析TB Lee植物标本馆维管植物标本的采集者与鉴定者关联关系
- 标本数据质量核查:通过日期问题相关文件,核查标本采集、鉴定日期的准确性
- 生物多样性信息基础设施研究:支持全球生物多样性信息设施(GBIF)聚合数据的应用与拓展研究
- 志愿者参与的生物标本数据标注机制研究:分析Bionomia平台志愿者标注的标本数据特征与价值