数据集概述
本数据集包含UAM Herbarium (ALA)和Cryptogam Collection (Arctos)自然历史标本与采集者、鉴定者的关联数据,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data数据包格式组织,共包含九个文件。
文件详解
- 数据文件包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集的元数据信息
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本关联的引用文献数据
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含参与标注的用户相关数据
- 鉴定者日期问题数据文件
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含鉴定者日期存在问题的标本数据
- 文章数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本关联的学术文章数据
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者日期存在问题的标本数据
- 归属数据文件
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本采集者、鉴定者的归属标注数据
- 排除断言数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标注为“非该采集者/鉴定者”的断言数据
- occurrence数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本的 occurrence 核心数据
数据来源
Bionomia(基于GBIF数据集39f7ffd7-9416-4efb-934a-c81f116893fc)
适用场景
- 生物标本数据标准化研究: 分析标本采集者、鉴定者信息的关联模式与标准化方法
- 生物多样性数据质量评估: 利用日期问题数据研究标本元数据的质量问题及改进方向
- 自然历史标本馆数据整合: 为UAM Herbarium与Cryptogam Collection的标本数据整合提供关联依据
- 公民科学贡献分析: 研究Bionomia志愿者在标本数据标注中的贡献模式与质量
- 生物分类学历史研究: 通过采集者、鉴定者关联数据追溯分类学研究的历史脉络