数据集概述
本数据集为德克萨斯大学生物多样性中心鱼类学标本馆(TNHCi)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据整理,以Frictionless Data数据包格式呈现,包含9个相关文件。
文件详解
- 数据文件(共9个,含8个压缩文件和1个JSON文件)
citations.csv.zip:CSV压缩文件,可能包含标本相关文献引用信息
occurrences.csv.zip:CSV压缩文件,可能包含标本采集记录信息
attributions.csv.zip:CSV压缩文件,可能包含采集者与鉴定者的归属信息
articles.csv.zip:CSV压缩文件,可能包含相关研究文献信息
users.csv.zip:CSV压缩文件,可能包含标注志愿者等用户信息
datapackage.json:JSON文件,Frictionless Data数据包描述文件,定义数据集结构与元数据
problem_collector_dates.csv.zip:CSV压缩文件,可能包含采集者日期信息异常的记录
not_them_assertions.csv.zip:CSV压缩文件,可能包含非指定采集者/鉴定者的标注记录
problem_determiner_dates.csv.zip:CSV压缩文件,可能包含鉴定者日期信息异常的记录
数据来源
Bionomia平台(基于GBIF数据集:https://gbif.org/dataset/6080b6cc-1c24-41ff-ad7f-0ebe7b56f311)
适用场景
- 生物多样性标本溯源研究:通过采集者与鉴定者关联数据,追溯鱼类标本的采集与鉴定历史
- 鱼类学标本馆数据管理:辅助TNHCi鱼类学标本馆的标本信息标准化与质量控制
- 生物多样性数据整合:为全球生物多样性信息系统提供结构化的标本关联数据支持
- 标本标注质量分析:通过异常日期记录文件,分析标本元数据的质量问题与改进方向