数据集概述
本数据集关联了美国国家寄生虫馆藏中Robert L. Rausch标本的采集者与鉴定者信息,由Bionomia志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,采用Frictionless Data数据包格式,包含9个文件。
文件详解
- 数据包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、资源和属性。
- 引用文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含数据集相关的引用信息。
- 采集者日期问题文件
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:记录采集者日期存在问题的数据条目。
- 鉴定者日期问题文件
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:记录鉴定者日期存在问题的数据条目。
- 用户信息文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:包含参与标注的用户信息。
- 文章文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:关联的学术文章信息。
- 归属信息文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:标本采集者与鉴定者的归属标注信息。
- 排除断言文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:标注为非目标采集者/鉴定者的断言信息。
- occurrence文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(ZIP压缩)
- 字段映射介绍:标本的 occurrence(事件)信息。
数据来源
Bionomia(志愿者标注),基于全球生物多样性信息机构(GBIF)聚合的数据集(https://gbif.org/dataset/82c3a0ae-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本数据管理: 用于关联和验证寄生虫标本的采集者与鉴定者信息,提升标本数据的准确性。
- 生物多样性研究: 分析Robert L. Rausch采集的寄生虫标本的分布特征及相关研究背景。
- 数据质量评估: 通过问题日期文件识别标本数据中的时间信息错误,支持数据清洗与标准化。
- 志愿者贡献分析: 基于用户信息文件研究Bionomia平台志愿者的标注行为与贡献模式。