数据集概述
本数据集包含真菌18S核糖体RNA参考序列目标基因座项目的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者在Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 数据文件
- 文件名称:citations.csv.zip、attributions.csv.zip、users.csv.zip、occurrences.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:包含标本采集者/鉴定者关联信息、用户数据、标本记录、文献引用、日期问题记录、身份排除声明等结构化数据
- 元数据文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集结构、文件清单及格式定义
数据来源
Bionomia平台(数据集ID:3bfbda20-1a91-4cf9-992f-bc1e9e5b7dad),原始标本数据来自全球生物多样性信息设施(GBIF,数据集ID:3bfbda20-1a91-4cf9-992f-bc1e9e5b7dad)
适用场景
- 真菌分类学研究:通过标本采集者/鉴定者关联信息验证分类学数据的可靠性
- 生物多样性数据整合:补充真菌标本的元数据信息,完善全球生物多样性数据库
- 标本数据质量控制:分析标本日期问题记录,优化标本数据清洗流程
- 公民科学贡献研究:评估志愿者在生物标本数据标注中的贡献模式与质量