数据集概述
本数据集为路易斯安那州立大学雪莉·C·塔克植物标本馆苔藓植物标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,原始标本数据来自全球生物多样性信息设施(GBIF)。数据以Frictionless Data数据包格式组织,包含9个文件,涵盖关联归属、问题日期记录、文献引用等信息。
文件详解
- 关联归属文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含Bionomia志愿者对标本采集者、鉴定者的关联归属信息
- 问题采集者日期文件
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者日期存在问题的标本关联数据
- 问题鉴定者日期文件
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录鉴定者日期存在问题的标本关联数据
- 非匹配断言文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为非目标采集者/鉴定者的关联断言数据
- 文献引用文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本关联数据相关的文献引用信息
- 标本记录文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:苔藓植物标本的基础记录信息
- 用户信息文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的Bionomia志愿者用户信息
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述,包含数据集结构、文件清单等信息
数据来源
Bionomia(基于全球生物多样性信息设施GBIF数据集:https://gbif.org/dataset/f3af5cc9-4d39-4125-8739-2bbe5cf9d9cc)
适用场景
- 生物标本数据关联分析:研究苔藓植物标本采集者、鉴定者的关联关系与历史记录
- 生物多样性信息标准化:验证标本元数据中日期、人员信息的准确性与完整性
- 志愿者标注数据质量评估:分析Bionomia平台志愿者标注数据的问题类型与分布
- 植物标本馆数据管理优化:为苔藓植物标本馆的人员信息关联与数据清洗提供参考
- 生物分类学研究支持:辅助苔藓植物分类学研究中采集者、鉴定者背景信息的追溯