数据集概述
本数据集为美国自然科学院鱼类学馆藏的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据集生成,采用Frictionless Data数据包格式,包含9个文件。
文件详解
- 数据集描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的描述文件,通常包含数据集元信息、文件清单、字段定义等
- 标本发生数据文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含标本的基本发生信息,如采集时间、地点、物种等
- 引用数据文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含标本相关的文献引用信息
- 文章数据文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含与标本相关的学术文章信息
- 用户数据文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含标注数据的志愿者用户信息
- 归属数据文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含采集者与鉴定者的归属信息
- 非归属断言数据文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含非归属关系的断言信息
- 鉴定者日期问题数据文件
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含鉴定者日期存在问题的记录
- 采集者日期问题数据文件
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:可能包含采集者日期存在问题的记录
数据来源
Bionomia平台(志愿者标注),基于全球生物多样性信息机构(GBIF)聚合的标本数据集(数据集ID:de22e531-395a-468b-8830-bd1a8ad04673)
适用场景
- 生物多样性研究:用于分析鱼类标本的采集者与鉴定者分布情况
- 标本数据质量控制:利用问题日期文件识别和修正标本数据中的时间错误
- 科学史研究:通过采集者与鉴定者关联信息,研究鱼类学研究的历史脉络
- 志愿者贡献分析:分析Bionomia平台志愿者在标本数据标注中的贡献情况
- 生物标本数据标准化:基于Frictionless Data格式,推动标本数据的标准化共享与整合