数据集概述
本数据集为南美Gyponini亚科分类研究的自然历史标本关联数据,包含标本与采集者、鉴定者的关联信息,基于GBIF聚合的标本数据,由Bionomia志愿者标注。数据以Frictionless数据包格式组织,共9个文件,支持昆虫分类学研究中采集者与鉴定者信息的追溯与分析。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集的基本描述、文件清单及格式定义
- 压缩数据文件(共8个ZIP文件)
- 文件名称:
citations.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(内含CSV文件)
- 字段映射介绍:
occurrences.csv:标本 occurrence 核心数据,含标本与分类单元关联信息
attributions.csv:采集者与鉴定者的归属标注数据
citations.csv:相关文献引用数据
users.csv:Bionomia志愿者用户数据
problem_collector_dates.csv/problem_determiner_dates.csv:采集/鉴定日期异常的标本记录
not_them_assertions.csv:非目标采集者/鉴定者的排除标注数据
articles.csv:关联的文献文章数据
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:20b63e1c-aaa6-4477-9a94-d7acd27c44ed);Bionomia平台(https://bionomia.net/dataset/20b63e1c-aaa6-4477-9a94-d7acd27c44ed)
适用场景
- Gyponini分类学研究:支持南美Gyponini亚科新属修订及分类变更中的标本采集者与鉴定者信息追溯
- 生物标本元数据完善:用于补充自然历史标本的采集者、鉴定者及日期等关键元数据
- 分类学历史分析:通过采集者与鉴定者关联数据,研究昆虫分类学研究的历史脉络与研究者网络
- 标本数据质量控制:利用日期异常及排除标注数据,优化标本元数据的准确性与完整性
- 生物多样性数据整合:为GBIF标本数据与Bionomia研究者数据的关联整合提供基础支持