数据集概述
本数据集为“Abromeit目录数字化”项目中自然历史标本数据与采集者、鉴定者的关联数据,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据集,以Frictionless Data数据包格式组织,包含9个文件,用于记录标本相关的人员关联、引用、断言及问题数据等信息。
文件详解
- 压缩文件(共8个,格式为.zip)
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、attributions.csv.zip、users.csv.zip、occurrences.csv.zip
- 内容说明:分别对应标本引用数据、非关联断言数据、采集者日期问题数据、鉴定者日期问题数据、文献文章数据、人员关联归因数据、用户数据、标本 occurrence 数据
- 配置文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 内容说明:Frictionless Data数据包的配置文件,用于描述数据集的元数据信息
数据来源
Bionomia平台志愿者标注,基于Global Biodiversity Information Facility聚合的数据集(https://gbif.org/dataset/52b30c1a-80cd-4a67-97f6-1fefc8d2d3e6)
适用场景
- 生物标本元数据完善:补充自然历史标本的采集者、鉴定者关联信息,提升标本数据完整性
- 生物多样性研究人员关联分析:探索标本背后科研人员的协作网络与贡献
- 标本数据质量评估:通过问题日期数据识别标本元数据中的时间信息错误
- 生物多样性信息平台数据整合:为GBIF等平台提供标准化的标本-人员关联数据支持