数据集概述
本数据集包含巴西坎皮纳斯州立大学标本馆(UEC)的自然历史标本数据,记录了标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据文件包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集元信息
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用信息
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据标注的用户信息
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的标本记录
- 非本人声明数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为非本人参与的标本记录声明
- 文献数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的文献信息
- 归属数据文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本采集者与鉴定者的归属信息
- 发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本的发生记录信息
- 鉴定者日期问题数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的标本记录
数据来源
Bionomia平台(数据集ID:7741a517-ab3d-4b85-ae58-56322e44c8ce)、全球生物多样性信息机构(GBIF,数据集ID:7741a517-ab3d-4b85-ae58-56322e44c8ce)
适用场景
- 生物标本采集者与鉴定者研究: 分析UEC标本馆标本的采集者、鉴定者分布及关联关系
- 生物多样性数据质量评估: 基于日期问题数据,评估标本记录的时间信息准确性
- 生物标本文献关联分析: 通过文献数据,研究标本与相关学术文献的关联
- 志愿者数据标注贡献分析: 分析Bionomia平台志愿者对标本数据标注的贡献情况
- 生物标本归属信息研究: 探究标本采集者与鉴定者的归属关系及标注情况