数据集概述
本数据集为夏威夷大学昆虫博物馆的自然历史标本数据,包含与标本采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集构建,以Frictionless数据包格式组织,共包含九个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless数据包的元数据文件,包含数据集的结构、文件清单等描述信息
- 压缩数据文件
- 文件名称:citations.csv.zip、not_them_assertions.csv.zip、articles.csv.zip、attributions.csv.zip、problem_collector_dates.csv.zip、users.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本采集者与鉴定者的关联归属、引用文献、问题日期记录、用户信息及标本 occurrence 数据等结构化内容
数据来源
Bionomia平台(志愿者标注)、Global Biodiversity Information Facility(GBIF)聚合数据集
适用场景
- 生物标本元数据标准化研究:分析昆虫标本采集者、鉴定者信息的关联规则与标注规范
- 生物多样性数据整合:支持夏威夷大学昆虫博物馆标本数据与全球生物多样性数据库的关联整合
- 自然历史标本管理优化:识别标本采集、鉴定过程中的日期问题等数据质量问题,提升标本管理效率
- 生物分类学研究辅助:为昆虫分类学研究提供标本采集者、鉴定者的背景关联信息支撑