数据集概述
本数据集是Proyecto Santander BIO项目下“Santander省圣巴巴拉市鸟类”的标本数据关联文件,包含采集者与鉴定者的归属信息。数据由Bionomia平台志愿者标注,基于Global Biodiversity Information Facility聚合的标本数据,采用Frictionless Data数据包格式,共9个文件。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、格式等信息。
- 关联归属文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:包含标本数据与采集者、鉴定者的关联归属信息。
- 引用文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本相关的引用文献信息。
- 文章文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:与标本相关的学术文章信息。
- 出现记录文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鸟类标本的出现记录数据。
- 用户文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与标注的志愿者用户信息。
- 问题日期文件
- 文件名称:
problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者和鉴定者日期信息存在问题的记录。
- 排除断言文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标注为“非该人员”的断言信息。
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(标本数据聚合)
适用场景
- 生物多样性研究:分析Santander省圣巴巴拉市鸟类标本的采集与鉴定信息,支持区域鸟类多样性研究。
- 标本数据管理:完善鸟类标本的采集者、鉴定者关联信息,提升标本数据的完整性。
- 公民科学分析:研究志愿者在Bionomia平台的标注行为与贡献,为公民科学项目提供参考。
- 数据质量评估:通过问题日期文件识别标本数据中的时间信息错误,优化数据清洗流程。
- 文献关联分析:利用引用和文章文件,探索鸟类标本研究的学术脉络与相关文献。