数据集概述
本数据集为北领地博物馆与美术馆作为OZCAM提供者的自然历史标本数据,关联了标本对应的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,包含数据集元信息、资源清单及格式规范
- 压缩数据文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用文献数据
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的标本记录
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为“非该采集者/鉴定者”的断言数据
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:相关学术文章信息
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本 occurrence(出现记录)数据
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者日期存在问题的标本记录
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者与鉴定者的归属标注数据
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的志愿者用户信息
数据来源
Bionomia平台(数据集ID:793c3890-6c8a-11de-8226-b8a03c50a862)、全球生物多样性信息机构(GBIF,数据集ID:793c3890-6c8a-11de-8226-b8a03c50a862)
适用场景
- 生物标本采集者/鉴定者信息分析:研究自然历史标本背后的研究者网络及贡献
- 生物多样性数据质量评估:通过问题日期文件分析标本元数据的准确性与完整性
- 志愿者科学贡献研究:基于用户数据与归属数据,分析公民科学项目的参与模式
- 标本引用文献关联研究:整合引用与文章数据,构建标本与学术成果的关联网络
- 生物多样性信息标准化:基于Frictionless Data格式,探索标本数据的标准化存储与交换方式