数据集概述
本数据集为Trimma tevegae、T. caudomaculatum及西太平洋三种新相似种相关的生物标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据集,以Frictionless Data包格式组织,包含9个文件,支持生物分类学研究中标本信息的追溯与管理。
文件详解
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标本相关的文献引用数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含鉴定者日期存在问题的标本记录
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,包含数据集的元数据信息
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含与标本相关的学术文章数据
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标注为“非目标物种”的标本断言数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含采集者日期存在问题的标本记录
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含参与标注的志愿者用户数据
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标本的 occurrence( occurrence 指生物标本的采集事件记录)数据
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未提供具体字段信息,推测包含标本采集者与鉴定者的关联归属数据
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:c9808a7d-3696-45cc-a337-5448ce845ec6),由Bionomia志愿者标注
适用场景
- 生物分类学研究: 用于Trimma属鱼类标本的采集者与鉴定者信息追溯,支持物种修订与描述工作
- 生物多样性数据管理: 整合标本的采集、鉴定及文献引用信息,提升数据完整性与可追溯性
- 标本数据质量控制: 基于problem_determiner_dates.csv.zip等文件,分析标本日期信息的质量问题,优化数据清洗流程
- 志愿者贡献研究: 通过users.csv.zip分析Bionomia平台志愿者的标注行为与贡献模式