数据集概述
本数据集包含墨西哥塔毛利帕斯州马德雷泻湖无脊椎动物和涉禽(软体动物)的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据集,采用Frictionless Data数据包格式组织,共包含9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,可能包含数据集的基本信息、文件清单、数据模式等描述(具体字段未提供预览)
- 压缩数据文件(共8个,格式均为ZIP)
- 文件名称及内容概述:
- citations.csv.zip:可能包含标本相关的引用文献数据
- problem_determiner_dates.csv.zip:可能包含鉴定者日期存在问题的标本记录
- articles.csv.zip:可能包含与标本相关的文献文章数据
- users.csv.zip:可能包含参与标注的Bionomia志愿者用户数据
- attributions.csv.zip:可能包含标本采集者与鉴定者的归属关联数据
- not_them_assertions.csv.zip:可能包含标注为“非该采集者/鉴定者”的断言数据
- occurrences.csv.zip:可能包含标本的 occurrence( occurrence 通常指标本的采集事件或记录)数据
- problem_collector_dates.csv.zip:可能包含采集者日期存在问题的标本记录
数据来源
Bionomia平台(基于GBIF数据集:https://gbif.org/dataset/f8a42ec9-98c5-46bf-a1f5-20f070f7b367)
适用场景
- 生物标本采集者与鉴定者关联分析: 研究墨西哥马德雷泻湖软体动物标本的采集者、鉴定者及其关联关系
- 生物多样性标本元数据质量评估: 分析标本采集日期、鉴定日期的问题记录,评估标本元数据质量
- 生物标本文献引用研究: 基于引用文献和文章数据,研究标本相关的学术文献关联情况
- 公民科学参与分析: 分析Bionomia志愿者用户对标本数据的标注贡献
- 标本归属断言验证: 验证标本采集者与鉴定者归属断言的准确性,优化标本元数据关联逻辑