数据集概述
本数据集为Fiocruz/CSIOC(奥斯瓦尔多·克鲁兹研究所蚋科标本馆)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集构建,以Frictionless Data数据包格式组织,包含9个相关文件。
文件详解
- 核心数据文件(.zip格式):
- citations.csv.zip:引用相关数据压缩包
- occurrences.csv.zip:标本 occurrence 数据压缩包
- attributions.csv.zip:归属信息数据压缩包
- articles.csv.zip:文献关联数据压缩包
- problem_collector_dates.csv.zip:采集者日期问题数据压缩包
- problem_determiner_dates.csv.zip:鉴定者日期问题数据压缩包
- not_them_assertions.csv.zip:非关联声明数据压缩包
- users.csv.zip:用户相关数据压缩包
- 数据包描述文件:
- datapackage.json:JSON格式,Frictionless Data数据包的元数据描述文件
数据来源
Bionomia平台(数据集ID:92de65b8-dd15-4477-a147-94aebcee03c3),基于全球生物多样性信息设施(GBIF)聚合的标本数据集(数据集ID:92de65b8-dd15-4477-a147-94aebcee03c3)
适用场景
- 生物标本元数据整合:关联蚋科标本的采集者、鉴定者信息,完善标本元数据
- 生物多样性数据质量控制:通过问题日期文件分析标本记录的时间信息准确性
- 生物分类学研究支持:为蚋科标本的分类学研究提供采集与鉴定人员关联数据
- 科学贡献者归因分析:基于归属信息与用户数据,分析标本相关科学贡献者的贡献情况
- 生物多样性信息平台数据对接:以Frictionless Data格式支持与其他生物多样性信息平台的数据交换