数据集概述
本数据集为《Poriptus属修订》研究关联的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由Bionomia志愿者标注,基于GBIF聚合的标本数据,以Frictionless Data包格式组织,含9个文件,支持昆虫分类学研究中标本信息的溯源与分析。
文件详解
- 数据文件包
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,定义数据集的元数据、文件清单及数据结构规范
- 压缩数据文件(共8个ZIP文件)
- 文件名称:
citations.csv.zip、occurrences.csv.zip、articles.csv.zip、attributions.csv.zip、problem_determiner_dates.csv.zip、problem_collector_dates.csv.zip、users.csv.zip、not_them_assertions.csv.zip
- 文件格式:ZIP(压缩CSV文件)
- 字段映射介绍:包含标本引用、 occurrence记录、相关文献、标注归属、日期问题记录、用户信息、非本人标注声明等结构化数据,具体字段需解压后查看CSV内容
数据来源
Global Biodiversity Information Facility(GBIF)数据集(编号:5c0c2f5c-adc0-4cca-a4a8-f1efeb00ffb8)、Bionomia平台志愿者标注
适用场景
- 昆虫分类学研究:支持Poriptus属修订研究中标本采集者、鉴定者信息的溯源与验证
- 生物标本数据管理:分析标本关联信息的完整性与准确性,优化数据质量
- 生物多样性数据整合:作为GBIF与Bionomia数据关联的案例,探索跨平台生物数据整合方法
- 科学标注行为研究:通过attributions.csv.zip等文件分析志愿者标注的贡献模式与质量