数据集概述
本数据集包含MG herbarium(Museu Paraense Emílio Goeldi Herbário Virtual REFLORA)标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,基于Global Biodiversity Information Facility聚合的标本数据,以Frictionless Data数据包格式组织,含9个文件,用于生物标本关联信息的管理与分析。
文件详解
- 核心数据文件(压缩包)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、attributions.csv.zip、articles.csv.zip、users.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:分别包含标本引用信息、采集者日期问题记录、标注归属信息、相关文献、标注用户、排除标注记录、标本 occurrence 数据、鉴定者日期问题记录等关联数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据包元数据文件,定义数据集结构、文件清单及数据规范
数据来源
Global Biodiversity Information Facility(数据集ID:803eb96c-4779-41e3-a511-fd124732774f);Bionomia平台(志愿者标注)
适用场景
- 生物标本采集者/鉴定者关联分析: 研究MG herbarium标本的采集者、鉴定者信息关联关系与历史记录
- 标本数据质量核查: 利用日期问题文件分析采集者、鉴定者日期信息的准确性与完整性
- 生物多样性标注贡献研究: 通过用户与归属文件分析志愿者对标本数据标注的贡献情况
- 标本文献关联研究: 结合引用与文献文件探索标本数据与学术文献的关联关系
- 生物标本数据标准化应用: 基于Frictionless Data格式开展生物标本关联数据的标准化管理实践