数据集概述
本数据集为瑞典自然历史博物馆无脊椎动物收藏的标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者在Bionomia平台上标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含九份文件,涵盖标本记录、关联信息及问题数据等内容。
文件详解
- 数据文件包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、文件清单及字段描述等信息。
- 压缩数据文件(共8个)
- 文件名称:citations.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、occurrences.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:
- citations.csv.zip:标本相关的引用信息
- problem_collector_dates.csv.zip:采集者日期存在问题的记录
- not_them_assertions.csv.zip:非指定采集者/鉴定者的声明记录
- attributions.csv.zip:采集者与鉴定者的关联归属信息
- occurrences.csv.zip:标本 occurrence(出现记录)数据
- articles.csv.zip:相关文献文章信息
- problem_determiner_dates.csv.zip:鉴定者日期存在问题的记录
- users.csv.zip:参与标注的用户信息
数据来源
Bionomia平台(基于GBIF数据集:https://gbif.org/dataset/56aa0680-0c60-11dd-84cd-b8a03c50a862)
适用场景
- 生物标本采集者/鉴定者关联研究:分析无脊椎动物标本与采集者、鉴定者的关联关系,梳理标本采集历史脉络。
- 生物多样性数据质量评估:通过problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip等文件,识别并修正标本日期信息的错误。
- 标本数据引用分析:利用citations.csv.zip和articles.csv.zip,研究标本数据在学术文献中的引用情况。
- 公民科学参与研究:通过users.csv.zip分析Bionomia平台志愿者的标注行为与贡献。
- 自然历史标本数字化整合:结合occurrences.csv.zip与attributions.csv.zip,完善瑞典自然历史博物馆无脊椎动物标本的数字化记录。