数据集概述
本数据集包含PaDIL平台内自然历史标本与采集者、鉴定者的关联数据,由Bionomia志愿者Scribes基于Global Biodiversity Information Facility聚合的标本数据标注生成,采用Frictionless Data数据包格式,共包含9个文件,支持生物多样性标本数据的关联分析与溯源。
文件详解
- 压缩文件(ZIP格式,共8个)
- 文件名称:citations.csv.zip、attributions.csv.zip、articles.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP
- 字段映射介绍:各压缩文件包含对应主题的CSV数据,分别涉及标本引用、采集者/鉴定者归属、相关文献、用户信息、采集日期问题记录、身份排除声明、标本记录、鉴定日期问题记录等内容
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:遵循Frictionless Data标准,描述数据集的元信息,包括文件清单、数据结构定义等
数据来源
Bionomia平台志愿者标注,原始标本数据来自Global Biodiversity Information Facility(数据集ID:e731a329-1fe3-4497-9e3c-24cb9235b5a1)
适用场景
- 生物多样性标本溯源:通过采集者与鉴定者关联数据,追溯PaDIL标本的采集与鉴定背景
- 标本数据质量核查:利用问题日期记录文件,分析标本采集/鉴定日期的异常情况,优化数据质量
- 生物分类学研究:结合归属数据与标本记录,分析特定类群标本的采集者分布与鉴定者专业背景
- 公民科学贡献评估:通过用户信息文件,评估Bionomia志愿者在标本数据关联工作中的贡献情况