数据集概述
本数据集为阿肯色大学标本馆的自然历史标本数据,包含与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集元信息、文件清单及数据结构规范
- 压缩数据文件
- 文件名称:
citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本相关引用数据
- 文件名称:
articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:相关文献文章数据
- 文件名称:
attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者与鉴定者的归属标注数据
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:非目标对象的声明数据
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:采集者日期存在问题的数据记录
- 文件名称:
users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:参与标注的用户信息数据
- 文件名称:
occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:标本 occurrence(事件)数据
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:鉴定者日期存在问题的数据记录
数据来源
Bionomia平台(数据集ID:f523ee81-ea8c-4b30-a058-4375747e692a)、全球生物多样性信息设施(GBIF,数据集ID:f523ee81-ea8c-4b30-a058-4375747e692a)
适用场景
- 生物标本馆数据管理: 用于整理阿肯色大学标本馆标本与采集者、鉴定者的关联关系,完善标本元数据
- 生物多样性研究: 分析标本采集者、鉴定者的分布及贡献,支撑生物多样性历史动态研究
- 志愿者标注数据应用: 评估Bionomia平台志愿者标注数据的质量与应用价值
- 数据问题排查: 利用日期问题数据文件,优化标本采集、鉴定日期的标准化处理流程