数据集概述
本数据集为PLOS Biology期刊文章《Public human microbiome data are dominated by highly developed countries》的补充数据,包含人类微生物组样本的国家分布、样本标签统计、生物样本元数据等核心内容,支持研究全球人类微生物组公开数据的地域分布特征。
文件详解
- 文档说明文件:
- README.txt:TXT格式,说明数据集文件结构、各文件内容及字段定义,包含补充表和数据集的详细描述
- figures.md:MD格式,可能为图表生成说明文档
- 补充表格文件(CSV格式):
- supp_table01.csv:样本标签统计,字段包括tag(生物样本标签名)、samples(含该标签的样本数)、coverage(标签覆盖样本比例)
- supp_table02.csv:不同身体部位样本的国家分布统计,包含gut(肠道)、oral(口腔)、skin(皮肤)、vaginal(阴道)、lung(肺部)等部位的国家样本数
- supp_table04.csv:补充表4(具体内容未完全展示)
- country_counts.csv:国家样本数量统计
- region_years.csv:区域年度样本分布数据
- acceptable_hosts.csv:可接受的宿主列表
- 样本数据文件(CSV格式):
- samples.csv:人类微生物组样本元数据,字段包括srs(样本ID)、host(宿主)、source(样本来源)、srr(测序ID)、project(项目ID)、library_strategy(测序策略)、geo_loc_name(地理位置)等
- 压缩文件:
- biosample_data.zip:生物样本数据压缩包
- code.zip:分析代码压缩包
- 图表文件:
- figures_assembled.pdf:PDF格式,已整合的研究图表
数据来源
PLOS Biology期刊文章《Public human microbiome data are dominated by highly developed countries》(Abdill et al. 2022)
适用场景
- 微生物组研究:分析全球人类微生物组公开数据的地域分布特征,比较不同国家/地区样本数量差异
- 数据公平性研究:探究高收入国家与其他国家在微生物组数据贡献上的差距
- 生物样本库分析:统计不同身体部位(肠道、口腔、皮肤等)微生物组样本的国家分布规律
- 科研数据资源评估:评估全球人类微生物组公开数据的覆盖范围与代表性