数据集概述
本数据集为Naturalis生物多样性中心(NL)软体动物标本的采集者与鉴定者关联数据,由志愿者通过Bionomia平台基于GBIF聚合的标本数据生成,包含引文、文章、问题日期记录、归属信息、标本记录等文件,采用Frictionless Data数据包格式,共9个文件。
文件详解
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本关联的引文数据
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:相关学术文章数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的记录数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的记录数据
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者与鉴定者的归属关联数据
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集结构与属性
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:非目标采集者/鉴定者的断言记录数据
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:软体动物标本的 occurrence 记录数据
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据处理的用户信息数据
数据来源
Bionomia平台(志愿者Scribes贡献),基于Global Biodiversity Information Facility(GBIF)聚合的Naturalis Biodiversity Center (NL) - Mollusca数据集
适用场景
- 生物多样性标本溯源研究:分析软体动物标本采集者与鉴定者的关联关系,追溯标本采集历史
- 标本数据质量评估:通过problem_determiner_dates、problem_collector_dates等文件识别标本日期记录的问题
- 生物分类学研究:结合occurrences数据与采集者/鉴定者信息,支撑软体动物分类学分析
- 公民科学贡献分析:通过users.csv.zip分析志愿者在生物多样性数据整理中的参与情况
- 生物多样性信息学工具开发:基于Frictionless Data数据包格式,为标本关联数据的标准化处理提供案例参考