数据集概述
本数据集包含巴西里约热内卢联邦大学(UFRN)标本馆的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者整理,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式呈现,包含9个文件。
文件详解
- 压缩文件(共8个)
- 文件名称:citations.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、problem_collector_dates.csv.zip、not_them_assertions.csv.zip、users.csv.zip、attributions.csv.zip、occurrences.csv.zip
- 文件格式:ZIP
- 字段映射介绍:推测包含标本引用信息、鉴定者日期问题记录、相关文献、采集者日期问题记录、身份排除声明、用户信息、归属信息、标本 occurrence 数据等结构化内容(具体字段需解压后查看)
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:作为Frictionless Data数据包的描述文件,通常包含数据集元数据(如名称、描述、许可证)、文件清单及各文件的字段定义等信息
数据来源
Bionomia平台(数据集ID:15e887a4-973c-4b84-b421-ca65584a4c75),原始标本数据来自Global Biodiversity Information Facility(GBIF,数据集ID:15e887a4-973c-4b84-b421-ca65584a4c75)
适用场景
- 生物标本采集网络分析: 基于采集者与鉴定者关联数据,研究标本采集活动的协作网络与区域分布
- 分类学历史研究: 通过鉴定者信息追溯物种分类修订的历史脉络
- 标本数据质量评估: 利用problem_determiner_dates、problem_collector_dates等文件分析标本元数据的时间字段质量问题
- 生物多样性信息标准化: 参考Frictionless Data数据包格式,推动标本数据的结构化与互操作性优化
- 志愿者贡献研究: 通过users.csv.zip分析Bionomia平台志愿者参与标本数据整理的模式与贡献度