Single_Cell_Preterm_Dataset_基于CyTOF的早产女性单细胞数据集

数据集概述

本数据集为CyTOF技术采集的早产女性单细胞数据集,包含42个样本的4.2万个细胞数据,覆盖36个维度特征。样本分为17名早产女性和25名足月女性(作为预测标签),协变量包括孕周、流产史及子痫前期记录。数据集按CytoCo-set输入格式组织,含原始特征、标签协变量记录及实验文件示例,总计61个文件。

文件详解

  • 核心信息文件
  • 文件名称:csv_info.csv
  • 文件格式:CSV
  • 字段映射介绍:记录所有样本的真实标签(早产/足月)及协变量(孕周、流产史、子痫前期)
  • 样本原始特征文件
  • 文件名称:all文件夹下的X(sample_file_name)X.csv(如3.csv、38.csv)
  • 文件格式:CSV
  • 字段映射介绍:包含样本细胞的36个维度原始特征数据,字段包括CD45、CD66、CD7、CD19等免疫标志物及pCREB、pSTAT5等信号分子
  • 文件名映射文件
  • 文件名称:filenames_X(trials_number)X.json(如filenames_4.json)
  • 文件格式:JSON
  • 字段映射介绍:记录样本文件与实验编号的映射关系
  • 标签文件
  • 文件名称:test_labels_X(trials_number)X.csv(如test_labels_444.csv)
  • 文件格式:CSV
  • 字段映射介绍:实验相关的样本标签数据
  • 三元组列表文件
  • 文件名称:X(covariate)X_tripletlist_subpick_test_rffX(pooling_type)X_sameX(threshold)X_diffX(threshold)X.txt(如HistoryOfMiscarriage_tripletlist_subpick_test_rffmax_same0.2_diff0.2.txt)
  • 文件格式:TXT
  • 字段映射介绍:基于协变量(如流产史)生成的三元组实验数据,包含测试集和训练验证集的样本索引组合

数据来源

论文“peterson2021single”(参考文献标注)

适用场景

  • 早产女性免疫细胞特征研究: 分析早产与足月女性免疫细胞的36维度特征差异,探究早产的免疫机制
  • 妊娠相关疾病生物标志物筛选: 基于CD45、CD16等免疫标志物及信号分子数据,筛选子痫前期、流产史相关的生物标志物
  • 机器学习模型训练: 利用标注的标签和协变量数据,训练早产风险预测或免疫细胞分型模型
  • 免疫细胞亚群分析: 通过单细胞维度特征,研究早产女性免疫细胞亚群的分布及功能变化
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 227.04 MiB
最后更新 2026年1月12日
创建于 2026年1月12日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。