数据集概述
本数据集为Magdalena大学生物收藏中心竹节虫标本的采集者与鉴定者关联数据,包含由Bionomia志愿者标注的标本归属信息,基于全球生物多样性信息设施聚合的标本数据,以Frictionless数据包格式组织,共11个文件。
文件详解
- 数据包配置文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless数据包的配置文件,定义数据集的元数据信息
- 标本发生数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含竹节虫标本的发生记录信息
- 引用数据文件
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用文献数据
- 文章数据文件
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本相关的学术文章信息
- 用户数据文件
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的Bionomia用户信息
- 未解析用户数据文件
- 文件名称:users_unresolved.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:未完成解析的用户信息
- 采集者日期问题数据文件
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者日期存在问题的记录
- 缺失归属数据文件
- 文件名称:missing_attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:缺失归属信息的标本记录
- 非本人声明数据文件
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为非本人采集/鉴定的声明记录
数据来源
Bionomia(https://bionomia.net/dataset/52241c66-e923-4fd9-857d-506b9be6e904)、全球生物多样性信息设施(https://gbif.org/dataset/52241c66-e923-4fd9-857d-506b9be6e904)
适用场景
- 生物标本管理优化:用于完善竹节虫标本的采集者与鉴定者信息关联,提升标本数据质量
- 生物多样性研究:为竹节虫分类学、分布规律等研究提供带归属信息的标本数据支持
- 科学贡献追溯:通过采集者与鉴定者关联数据,追溯昆虫标本研究的学术贡献
- 志愿者标注成果分析:分析Bionomia平台志愿者对生物标本数据的标注情况与质量
- 标本数据标准化研究:基于Frictionless数据包格式,探索生物标本数据的标准化组织方式