数据集概述
本数据集为UWIZM鱼类标本馆标本数据与采集者、鉴定者的关联数据,由Bionomia平台志愿者通过GBIF聚合的标本数据标注生成,包含采集者、鉴定者信息及相关文献引用、归属声明等,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集整体信息、文件清单及各文件的结构定义
- 文献引用文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的文献引用数据
- 文章关联文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本关联的学术文章信息
- 归属声明文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:志愿者在Bionomia上对标本采集者、鉴定者的归属声明数据
- 采集者日期问题文件
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期信息存在问题的记录数据
- 用户信息文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的Bionomia志愿者用户信息
- 排除声明文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:明确排除特定人员为采集者/鉴定者的声明数据
- 标本 occurrence 文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本的 occurrence 核心数据,含标本基本信息及关联的采集者、鉴定者ID
- 鉴定者日期问题文件
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期信息存在问题的记录数据
数据来源
Bionomia平台(数据集ID:640ae8b7-14b9-4188-894a-a2bc3821c752),原始标本数据来自Global Biodiversity Information Facility(GBIF,数据集ID:640ae8b7-14b9-4188-894a-a2bc3821c752)
适用场景
- 生物标本数据溯源:通过采集者、鉴定者关联信息追溯UWIZM鱼类标本的采集背景与鉴定过程
- 生物多样性研究:整合标本 occurrence 数据与人员信息,分析区域鱼类多样性的研究历史
- 科学贡献者分析:统计参与UWIZM鱼类标本采集、鉴定的人员分布及贡献情况
- 数据质量评估:利用日期问题文件识别标本元数据中的时间信息错误,优化数据集质量
- 志愿者标注行为研究:通过用户信息与归属声明数据,分析Bionomia平台志愿者的标注模式与效率