数据集概述
本数据集为"Aves MZS"鸟类标本的采集者与鉴定者关联数据,由Bionomia平台志愿者标注生成,原始标本数据来自GBIF聚合的数据集。数据以Frictionless Data包格式组织,包含9个文件,涉及标本记录、人员关联、文献引用及问题数据等内容。
文件详解
- 数据集描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的元数据文件,描述数据集整体信息、文件清单及数据结构定义
- 标本记录文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含Aves MZS鸟类标本的基础记录信息
- 人员关联文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本与采集者、鉴定者的关联归属信息
- 问题数据文件
- 文件名称:
problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:记录鉴定者、采集者日期信息存在问题的标本数据
- 文献引用文件
- 文件名称:
citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本相关的文献引用及文章信息
- 排除声明文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为非目标人员关联的标本声明数据
- 用户信息文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据标注的志愿者用户信息
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号868ad223-8e90-45e7-ba2c-c69751663ab1),经Bionomia平台志愿者标注生成
适用场景
- 生物标本数据标准化研究:分析标本采集者、鉴定者信息的关联与标准化方法
- 生物多样性数据质量评估:利用问题数据文件研究标本元数据的常见错误类型及改进方向
- 自然历史标本数字化管理:为博物馆标本数字化项目提供人员关联数据的组织参考
- 公民科学数据贡献研究:通过用户信息及标注数据,分析志愿者参与生物数据整理的模式与价值
- 生物分类学文献计量分析:结合文献引用文件,研究标本相关学术文献的分布特征