数据集概述
本数据集为胡安费尔南德斯群岛和德斯文图拉达斯群岛维管植物与非维管植物标本馆数据的扩展关联数据,通过Bionomia平台志愿者标注,将GBIF聚合的标本数据与采集者、鉴定者信息关联,包含标本采集、鉴定相关的属性断言及问题记录,采用Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据文件(压缩包)
- 文件名称:citations.csv.zip、occurrences.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip、articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:分别包含标本引用信息、标本记录、采集者/鉴定者非本人断言、采集者日期问题记录、属性归属信息、鉴定者日期问题记录、用户信息、相关文献文章数据
- 元数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据配置文件,定义数据集的结构、格式及各数据文件的描述信息
数据来源
Global Biodiversity Information Facility(GBIF)、Bionomia平台(志愿者Scribes标注)
适用场景
- 植物标本馆数据标准化:用于优化胡安费尔南德斯群岛植物标本馆数据的采集者、鉴定者信息关联与标准化处理
- 生物多样性标本溯源:通过关联数据追溯标本的采集者、鉴定者及采集背景,支撑标本历史记录研究
- 标本数据质量校验:利用problem_collector_dates、problem_determiner_dates等文件分析标本日期信息的准确性与问题
- 生物多样性信息学研究:整合GBIF与Bionomia数据,探索植物标本数据关联分析的方法与应用价值