数据集概述
本数据集为ICN - 哥伦比亚国立大学馆藏的自然历史标本关联数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,采用Frictionless Data数据包格式,共含9个文件。
文件详解
- 数据文件
- 文件名称:
citations.csv.zip、attributions.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip、problem_collector_dates.csv.zip、users.csv.zip
- 文件格式:ZIP(压缩包)
- 字段映射介绍:分别包含引用、归因、文献、鉴定者日期问题、身份排除声明、标本记录、采集者日期问题、用户信息等结构化数据
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,包含数据集元数据、文件清单及格式定义
数据来源
Bionomia平台志愿者标注(基于GBIF数据集:https://gbif.org/dataset/79684ec1-01e8-46cc-83cb-cd5bdfb469fe)
适用场景
- 生物标本数据管理:用于ICN哥伦比亚国立大学馆藏标本的采集者、鉴定者信息关联与追溯
- 生物多样性研究:分析标本记录中的人员关联信息,支撑生物分类学历史研究
- 数据质量评估:通过日期问题文件识别标本记录中的时间信息错误
- 生物标本元数据分析:整合多维度关联数据,优化标本数据集的结构化管理