数据集概述
该数据集为全球菊头蝠及近缘种标本的地理参考、校验和版本化数据产品,包含原始标本数据、数据处理代码、增强协议及不同里程碑的增强数据集,用于支持新冠病毒等人畜共患病起源与传播的研究。
文件详解
该数据集包含多类型文件,具体说明如下:
- 原始标本数据文件:
- 9d4b9069-48c4-4212-90d8-4dd6f4b7f2a5.zip: 来自iDigBio的原始数据,DwC-A格式
- 0067804-200613084148143.zip、0067806-200613084148143.zip: 来自GBIF的原始数据,DwC-A格式
- 处理与增强代码文件:
- RAPID-code_collection-date.R、RAPID-code_compile-deduplicate.R等7个R格式文件: 用于数据清洗、地理参考等增强处理的可复现代码
- 数据增强协议文件:
- RAPID-protocol_collection-date.pdf、RAPID-protocol_georeference.pdf等8个PDF格式文件: 数据增强各环节的操作规范
- 增强数据集文件:
- rapid-final-data-product_2021-06-29.zip: 增强后的标本数据集,DwC-A格式
- rapid-joined-records_country-cleanup_2020-09-23.csv: 原始数据合并去重、国家数据标准化后的初始版本
- rapid-final-gazetteer.zip: 包含一万零三百四十一个地点的地理参考数据及元数据
- bionomia-datasets-attributions.zip: 含103个Frictionless数据包,记录标本归属信息及日期匹配问题
- 元数据与说明文件:
- RAPID-data-dictionary.pdf、RAPID-data-dictionary.xlsx: 数据集术语元数据
- flagEventDate.txt、flagGeoreference.txt等8个TXT文件: DwC-A格式的术语定义参考
- rapid-data-providers_2021-05-03.csv: 数据提供者及记录数量清单
适用场景
- 病毒学研究: 分析菊头蝠等冠状病毒宿主的地理分布与病毒起源、传播的关联
- 生物多样性保护: 支持蝙蝠物种分布及栖息地保护策略制定
- 数据科学应用: 作为生物标本数据清洗、地理参考标准化的方法学案例
- 公共卫生研究: 为新冠病毒等人畜共患病的预警与防控提供数据支撑
- 自然历史标本数字化: 推动生物标本数据整合与开放共享的实践应用