数据集概述
本数据集为南极罗斯海冰下水母与栉水母的自然历史标本数据,关联了采集者和鉴定者信息,包含基于图像的机器学习训练集。数据由Bionomia志愿者标注,整合自Global Biodiversity Information Facility的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 压缩文件(.zip):共8个,包括:
- citations.csv.zip:引用数据文件
- not_them_assertions.csv.zip:非相关断言数据文件
- articles.csv.zip:文献数据文件
- users.csv.zip:用户数据文件
- problem_collector_dates.csv.zip:采集日期问题数据文件
- attributions.csv.zip:归属数据文件
- occurrences.csv.zip:标本出现记录数据文件
- problem_determiner_dates.csv.zip:鉴定日期问题数据文件
- 元数据文件:
- datapackage.json:Frictionless Data数据包的元数据文件,格式为JSON
数据来源
Bionomia(志愿者标注)、Global Biodiversity Information Facility(标本数据聚合)
适用场景
- 南极冰下生物多样性研究:分析罗斯海水母与栉水母的分布及标本信息
- 生物标本数据关联分析:研究采集者、鉴定者与标本的关联关系
- 机器学习训练:基于图像训练集开发南极冰下生物识别模型
- 生物多样性数据标准化:参考Frictionless Data格式优化标本数据组织
- 标本数据质量评估:利用问题日期文件分析标本记录的时间准确性