数据集概述
本数据集为《北美Hypotrix Guenee属修订:四种新种及一新属描述》相关的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless数据包格式组织,包含9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip、citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本 occurrence 记录、文献引用及相关文章信息
- 关联属性文件
- 文件名称:attributions.csv.zip、users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录Bionomia平台的用户归因及用户信息
- 问题数据文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含采集者/鉴定者日期问题记录及非本人标注声明
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless数据包的元数据描述文件
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号fc23db36-464b-42fb-b4dc-95d6df92600b),由Bionomia志愿者Scribes标注
适用场景
- 生物分类学研究:支持北美Hypotrix属及相关夜蛾科物种的分类修订与新种验证
- 标本数据标准化:用于分析自然历史标本采集者与鉴定者信息的关联与标准化处理
- 生物多样性数据整合:作为GBIF聚合数据的补充,提升标本数据的溯源性与可信度
- 分类学文献计量分析:通过citations.csv.zip和articles.csv.zip研究相关分类学文献的引用关系
- 公民科学数据质量评估:基于problem_*文件分析志愿者标注数据中的日期一致性等质量问题