数据集概述
本数据集为《苏门答腊植物志》中安达拉斯大学标本馆(ANDA)收藏的选定科维管植物标本的采集人、鉴定人关联数据,由Bionomia志愿者通过GBIF聚合的标本数据标注生成,包含9个文件,以Frictionless数据包格式组织,用于记录标本相关人员的关联信息。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(内部包含CSV文件)
- 字段映射介绍:分别记录引文信息、用户数据、鉴定人日期问题数据、文章信息、归属信息、非本人声明、标本 occurrence 数据、采集人日期问题数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据文件,描述数据集的结构、文件清单等信息
数据来源
Global Biodiversity Information Facility(GBIF)聚合的数据集(https://gbif.org/dataset/3e0987c4-375f-4d68-b2ac-5e4e3a6d3d6d),由Bionomia志愿者标注生成
适用场景
- 植物标本数字化管理:用于关联苏门答腊维管植物标本与采集人、鉴定人的信息,完善标本元数据
- 生物多样性研究:分析标本采集人、鉴定人的工作范围和贡献,支撑植物分类学、植物区系研究
- 标本数据质量控制:通过问题日期数据(problem_determiner_dates、problem_collector_dates)识别和修正标本记录中的时间信息错误
- 科学数据关联分析:结合归属信息(attributions)和非本人声明(not_them_assertions),研究标本数据的标注准确性和人员关联逻辑