数据集概述
本数据集包含哥伦比亚干旱森林虚拟标本馆(TOLI标本馆)中植物标本的采集者与鉴定者关联信息,由志愿者通过Bionomia平台基于GBIF聚合的标本数据生成。数据以Frictionless Data数据包格式组织,包含9个压缩文件及描述文件,覆盖标本引用、归属、出现记录等多维度信息。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的核心描述文件,定义数据集元数据、文件清单及数据结构规范
- 压缩数据文件(共8个)
- 文件名称:
citations.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:分别存储标本引用文献、学术文章、归属信息、排除断言、标本出现记录、采集者日期问题记录、鉴定者日期问题记录及用户数据
数据来源
Bionomia平台(数据集ID:5065080a-77d9-4a2d-a3f8-e65da9add067)、Global Biodiversity Information Facility(GBIF,数据集ID:5065080a-77d9-4a2d-a3f8-e65da9add067)
适用场景
- 生物标本馆数据标准化:用于规范哥伦比亚干旱森林标本馆采集者与鉴定者信息的关联格式
- 生物多样性研究:通过标本出现记录与归属信息分析区域物种分布特征
- 数据质量评估:利用日期问题记录优化标本采集与鉴定时间信息的准确性
- 志愿者贡献分析:通过用户数据研究公民科学参与者在生物标本数据整理中的贡献模式