数据集概述
本数据集为西班牙马拉加大学MGC标本馆MGC-Lichen数据集的衍生数据,包含与地衣标本关联的采集者、鉴定者信息,由Bionomia志愿者标注生成,基于GBIF聚合的标本数据,采用Frictionless Data数据包格式,共9个文件,涵盖标本记录、人员关联、问题数据等内容,可用于生物多样性标本的人员关联分析。
文件详解
- 核心数据文件(.zip格式)
- citations.csv.zip:引用相关数据压缩包
- occurrences.csv.zip:标本发生记录数据压缩包
- problem_collector_dates.csv.zip:采集者日期问题数据压缩包
- users.csv.zip:用户相关数据压缩包
- not_them_assertions.csv.zip:非本人声明数据压缩包
- articles.csv.zip:文章相关数据压缩包
- attributions.csv.zip:归属信息数据压缩包
- problem_determiner_dates.csv.zip:鉴定者日期问题数据压缩包
- 数据包描述文件
- datapackage.json:Frictionless Data数据包的元数据描述文件,JSON格式
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的MGC-Lichen数据集
适用场景
- 生物标本人员关联分析:研究地衣标本采集者、鉴定者的历史记录与关联关系
- 标本 metadata 质量评估:通过问题日期文件分析标本记录中的时间数据质量
- 生物多样性数据整合:作为GBIF聚合数据的补充,完善标本的人员信息维度
- 自然历史研究:支持基于标本采集者、鉴定者的地衣分类学历史研究
- 开放数据标准应用:验证Frictionless Data格式在生物多样性数据中的适用性