数据集概述
本数据集包含与"Dataflos"中的自然历史标本相关联的采集者和鉴定者信息,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据。数据以Frictionless Data数据包格式组织,共包含九个文件,用于记录标本的归属声明、引用信息及相关问题数据。
文件详解
- 主描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,定义数据集的结构、模式和相关属性
- 数据文件(压缩包格式)
- 文件名称:citations.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、problem_collector_dates.csv.zip、occurrences.csv.zip、problem_determiner_dates.csv.zip、users.csv.zip
- 文件格式:CSV压缩包(ZIP)
- 字段映射介绍:分别包含引用信息、文章数据、非归属声明、归属信息、采集者日期问题数据、标本记录、鉴定者日期问题数据及用户信息等内容
数据来源
Bionomia平台志愿者标注数据,基于全球生物多样性信息机构(GBIF)聚合的数据集(编号:812c1e24-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本元数据管理:用于整理自然历史标本的采集者、鉴定者关联信息,完善标本元数据
- 生物多样性研究:支持分析标本采集活动的历史分布、鉴定者专业背景等生物多样性相关研究
- 标本数据质量控制:通过问题日期数据(problem_collector_dates、problem_determiner_dates)识别和修正标本记录中的时间信息错误
- 志愿者贡献分析:基于users.csv.zip数据研究Bionomia平台志愿者的标注行为和贡献模式