数据集概述
本数据集为HUJ Herbarium维管植物标本的采集者与鉴定者关联数据,基于GBIF聚合的BioGIS维管植物标本数据,由Bionomia志愿者标注生成。包含标本记录、人员关联、引用文献等结构化信息,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip、attributions.csv.zip、users.csv.zip、articles.csv.zip、citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本采集者、鉴定者关联信息,用户标注记录,文献引用及文章数据等结构化字段
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录采集者/鉴定者日期问题、身份排除声明等异常数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述,包含数据集结构、字段定义等信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号52e0fe59-6da4-4707-ab31-c8873f415dc9)、Bionomia平台志愿者标注
适用场景
- 生物标本数字化管理: 用于HUJ Herbarium维管植物标本采集者与鉴定者信息的结构化整理与关联
- 生物多样性研究: 分析维管植物标本的采集历史、鉴定人员网络及标本分布特征
- 标本数据质量控制: 利用问题数据文件识别并修正标本采集/鉴定日期错误、人员身份误关联等问题
- 科学史研究: 探索植物分类学领域采集者与鉴定者的学术关联及历史贡献