数据集概述
本数据集为纳里尼奥大学微生物馆藏的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含11个文件,覆盖标本关联信息、问题数据及数据包描述等内容。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、资源及相关属性
- 标本关联数据文件
- 文件名称:occurrences.csv.zip、attributions.csv.zip、citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本记录、采集者/鉴定者关联归属、引用文献等核心数据
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、users_unresolved.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者/鉴定者日期问题、未解析用户及非关联声明等异常数据
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(原始标本数据聚合)
适用场景
- 生物标本数据管理:用于纳里尼奥大学微生物馆藏标本的采集者与鉴定者信息关联与整理
- 生物多样性研究:支持微生物标本相关的采集者、鉴定者网络及贡献分析
- 数据质量评估:通过问题数据文件分析标本元数据的完整性与准确性
- 科学引用分析:基于citations.csv.zip和articles.csv.zip研究标本相关文献的引用关系