数据集概述
本数据集为哥伦比亚国家卫生研究院(INS)医学重要性昆虫标本库中Psychodidae科标本的采集者与鉴定者关联数据,由Bionomia志愿者标注生成,基于全球生物多样性信息设施(GBIF)聚合的标本数据,包含标本记录、人员关联、引用文献等结构化信息,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 核心数据文件
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含Psychodidae科昆虫标本的基础记录信息,如标本编号、采集时间、地点等核心发生数据
- 人员关联文件
- 文件名称:users.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标注志愿者信息、采集者/鉴定者与标本的关联归因记录、人员身份排除断言等数据
- 文献引用文件
- 文件名称:citations.csv.zip、articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本相关的文献引用及学术文章关联信息
- 问题记录文件
- 文件名称:problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含采集者与鉴定者相关的日期异常记录数据
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,包含数据集结构、文件清单、字段定义等描述信息
数据来源
Bionomia平台(志愿者标注)、全球生物多样性信息设施(GBIF,数据集编号aac672c4-0109-4e0c-aa6e-36c790db9030)、哥伦比亚国家卫生研究院(INS)医学重要性昆虫标本库
适用场景
- 生物多样性标本数据标准化: 用于分析Psychodidae科医学昆虫标本记录的规范化程度,优化标本元数据管理
- 分类学历史研究: 通过采集者与鉴定者关联数据,追溯Psychodidae科昆虫分类学研究的人员网络与历史脉络
- 医学昆虫学研究: 为Psychodidae科(含白蛉等医学重要类群)的分布、生态研究提供标本数据支撑
- 公民科学数据质量评估: 分析Bionomia志愿者标注的采集者/鉴定者关联数据质量,优化生物标本众包标注流程
- 生物标本库数据整合: 为INS医学昆虫标本库与全球生物多样性数据平台的对接提供关联数据参考