数据集概述
本数据集为Harold W. Manter寄生虫学实验室标本馆(HWML)寄生虫标本的采集者与鉴定者关联数据,包含志愿者通过Bionomia平台标注的标本归属信息,基于全球生物多样性信息设施(GBIF)聚合的标本数据构建,以Frictionless Data数据包格式组织,共含9个文件。
文件详解
- 压缩文件(.zip格式)
- 文件名:citations.csv.zip、attributions.csv.zip、users.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip
- 文件格式:ZIP(压缩包内为CSV文件)
- 字段映射介绍:包含标本采集者/鉴定者关联信息、引用数据、用户数据、文献数据、日期问题记录、归属声明、标本发生记录等内容
- 数据包描述文件
- 文件名:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,定义数据集结构、文件清单及相关属性
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:c43384a9-8d9d-40c0-8cda-40ad47d2d69d);Bionomia平台志愿者标注数据
适用场景
- 生物标本馆数据管理:用于HWML寄生虫标本采集者与鉴定者信息的关联整合与标准化处理
- 生物多样性研究:支撑寄生虫标本采集历史、分类鉴定溯源的分析
- 标本数据质量控制:通过日期问题文件(problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip)优化标本元数据准确性
- 生物标本归属研究:基于attributions.csv.zip、not_them_assertions.csv.zip分析标本采集者/鉴定者的标注逻辑与归属关系