数据集概述
本数据集包含荷兰Naturalis生物多样性中心双翅目标本的采集者与鉴定者关联数据,由Bionomia志愿者Scribes基于全球生物多样性信息网络(GBIF)聚合的标本数据生成,采用Frictionless Data数据包格式,共含9个文件,用于记录标本相关人员的关联信息及问题数据。
文件详解
- 核心数据文件(压缩包)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、users.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本引用、人员排除声明、标本 occurrence 记录、采集者日期问题数据、用户信息、相关文献、人员归属信息、鉴定者日期问题数据等关联信息
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集结构、文件清单及相关规范信息
数据来源
Bionomia平台志愿者Scribes基于Global Biodiversity Information Facility(GBIF)聚合的Naturalis Biodiversity Center (NL) - Diptera数据集生成
适用场景
- 生物标本数据标准化:用于规范双翅目标本采集者与鉴定者信息的关联与格式化处理
- 生物多样性人员关联研究:分析标本相关人员(采集者、鉴定者)的归属关系及历史记录
- 标本数据质量控制:通过问题日期数据(problem_collector_dates、problem_determiner_dates)识别并修正标本时间信息错误
- 生物标本引用分析:利用citations.csv.zip数据研究双翅目标本的学术引用情况
- 生物多样性信息学工具开发:基于Frictionless Data格式开发标本数据关联与整合工具