数据集概述
本数据集关联了V.N.卡拉津哈尔科夫国立大学植物标本馆(CWU)收藏的植物标本的采集者与鉴定者信息,由志愿者通过Bionomia平台基于GBIF聚合的标本数据标注生成,包含标本归属、引用、未关联记录等11个文件,以Frictionless数据包格式组织。
文件详解
- 核心数据文件(.zip格式)
- 文件名:citations.csv.zip、attributions.csv.zip、missing_attributions.csv.zip、articles.csv.zip、occurrences.csv.zip、users_unresolved.csv.zip、problem_collector_dates.csv.zip、users.csv.zip
- 文件格式:CSV压缩包
- 内容说明:分别记录标本引用信息、归属标注信息、未关联归属记录、相关文献、标本记录、未解析用户、采集日期问题记录、用户信息等
- 元数据文件
- 文件名:datapackage.json
- 文件格式:JSON
- 内容说明:Frictionless数据包的元数据配置文件
数据来源
V. N. Karazin Kharkiv National University herbarium (CWU)、Global Biodiversity Information Facility(GBIF)、Bionomia平台
适用场景
- 植物标本馆数据管理:用于CWU标本馆采集者与鉴定者信息的关联整合与标准化
- 生物多样性研究:支撑标本采集历史、分类鉴定人员网络的分析
- 标本数据质量评估:通过problem_collector_dates等文件识别标本记录中的数据问题
- 志愿者标注成果应用:分析Bionomia平台志愿者标注的标本归属数据价值
- 生物多样性信息学研究:验证Frictionless数据包格式在标本关联数据中的应用效果