数据集概述
本数据集为NEON生物库鱼类标本(DNA提取物)的采集者与鉴定者关联数据,由志愿者在Bionomia平台标注,基于GBIF聚合的标本数据,包含采集者、鉴定者、标本归属等关联信息,采用Frictionless Data数据包格式,共9个文件。
文件详解
- 数据集文件包(Frictionless Data package)
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集元数据、文件结构及数据规范。
- 数据文件(压缩文件)
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含标本相关引用信息的结构化数据。
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:记录采集者日期存在问题的标本关联数据。
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:标注非对应采集者/鉴定者的断言数据。
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:标本与采集者、鉴定者的归属关联数据。
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:标本相关文献引用数据。
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:记录鉴定者日期存在问题的标本关联数据。
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:参与标注的志愿者用户信息数据。
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:标本采集事件及发生记录数据。
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)
适用场景
- 生物标本采集者与鉴定者关联分析: 用于研究NEON鱼类标本的采集者、鉴定者网络及标本归属关系。
- 生物多样性标本元数据质量评估: 通过问题日期数据,分析标本元数据的准确性与完整性。
- 志愿者参与式科学研究: 基于用户数据,研究志愿者在生物标本标注中的贡献模式。
- 生物标本引用网络构建: 利用引用和文献数据,构建鱼类标本的学术引用网络。
- 生物多样性数据标准化研究: 基于Frictionless Data格式,探索生物标本数据的标准化存储与共享方式。