数据集概述
本数据集为MCP-Anfibios两栖动物标本库的标本数据,包含与采集者、鉴定者的关联信息,由志愿者通过Bionomia平台标注,基于GBIF聚合的标本数据整理,采用Frictionless Data数据包格式,共9个文件,用于生物标本数据的关联分析与溯源。
文件详解
- 文件名称:citations.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含标本相关的引用文献信息
- 文件名称:articles.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含与标本相关的学术文章信息
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集结构与属性
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含标本采集者、鉴定者的归属标注信息
- 文件名称:users.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含参与标注的志愿者用户信息
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含两栖动物标本的 occurrence 记录信息
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含标注中排除错误关联的断言信息
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含鉴定者日期信息存在问题的标本记录
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(CSV压缩包)
- 字段映射介绍:推测包含采集者日期信息存在问题的标本记录
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的MCP-Anfibios标本数据集
适用场景
- 生物标本数据溯源:分析两栖动物标本的采集者、鉴定者关联信息,实现标本数据的来源追溯
- 生物多样性研究:结合标本 occurrence 数据,研究两栖动物的分布与多样性特征
- 标本数据质量控制:利用问题日期文件,优化标本采集、鉴定日期的记录质量
- 公民科学参与分析:通过用户信息文件,研究志愿者在生物标本数据标注中的参与模式
- 生物标本库管理:为MCP-Anfibios两栖动物标本库的数字化管理提供关联数据支持