数据集概述
本数据集包含与采集者和鉴定者关联的自然历史标本数据,来源于“馆藏数据库更新、濒危物种、种质资源收集与繁殖”项目。数据由Bionomia志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件(共9个,8个.zip压缩包,1个.json描述文件)
- 数据描述文件:
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,包含数据集结构、字段定义等信息。
- 压缩数据文件:
- 文件名称:citations.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含引用相关数据的CSV文件。
- 文件名称:not_them_assertions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含非关联断言数据的CSV文件。
- 文件名称:attributions.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含归属信息数据的CSV文件。
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含采集者日期问题数据的CSV文件。
- 文件名称:articles.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含文章相关数据的CSV文件。
- 文件名称:occurrences.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含标本 occurrence 数据的CSV文件。
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含鉴定者日期问题数据的CSV文件。
- 文件名称:users.csv.zip
- 文件格式:ZIP(内含CSV)
- 字段映射介绍:包含用户相关数据的CSV文件。
数据来源
Bionomia(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合的数据集(数据集ID:efd4552a-faa4-4f35-a5ac-007b9ca84e8e)
适用场景
- 生物多样性研究: 用于分析自然历史标本的采集者、鉴定者关联信息,支持生物多样性保护研究。
- 濒危物种保护: 基于馆藏数据库更新数据,辅助濒危物种的监测与保护策略制定。
- 种质资源管理: 利用种质资源收集与繁殖数据,支持农业、生态领域的种质资源保护与利用。
- 生物标本数据质量控制: 通过problem_collector_dates、problem_determiner_dates等数据,优化标本数据的准确性与完整性。
- 科学数据引用分析: 借助citations.csv.zip和articles.csv.zip,开展生物多样性研究领域的文献引用与学术影响分析。