数据集概述
本数据集为CyTOF技术采集的早产女性单细胞数据集,包含42个样本的4.2万个细胞数据,覆盖36个维度特征。样本分为17名早产女性和25名足月女性(作为预测标签),协变量包括孕周、流产史及子痫前期记录。数据集按CytoCo-set输入格式组织,含原始特征、标签协变量记录及实验文件示例,总计61个文件。
文件详解
- 核心信息文件
- 文件名称:csv_info.csv
- 文件格式:CSV
- 字段映射介绍:记录所有样本的真实标签(早产/足月)及协变量(孕周、流产史、子痫前期)
- 样本原始特征文件
- 文件名称:all文件夹下的X(sample_file_name)X.csv(如3.csv、38.csv)
- 文件格式:CSV
- 字段映射介绍:包含样本细胞的36个维度原始特征数据,字段包括CD45、CD66、CD7、CD19等免疫标志物及pCREB、pSTAT5等信号分子
- 文件名映射文件
- 文件名称:filenames_X(trials_number)X.json(如filenames_4.json)
- 文件格式:JSON
- 字段映射介绍:记录样本文件与实验编号的映射关系
- 标签文件
- 文件名称:test_labels_X(trials_number)X.csv(如test_labels_444.csv)
- 文件格式:CSV
- 字段映射介绍:实验相关的样本标签数据
- 三元组列表文件
- 文件名称:X(covariate)X_tripletlist_subpick_test_rffX(pooling_type)X_sameX(threshold)X_diffX(threshold)X.txt(如HistoryOfMiscarriage_tripletlist_subpick_test_rffmax_same0.2_diff0.2.txt)
- 文件格式:TXT
- 字段映射介绍:基于协变量(如流产史)生成的三元组实验数据,包含测试集和训练验证集的样本索引组合
数据来源
论文“peterson2021single”(参考文献标注)
适用场景
- 早产女性免疫细胞特征研究: 分析早产与足月女性免疫细胞的36维度特征差异,探究早产的免疫机制
- 妊娠相关疾病生物标志物筛选: 基于CD45、CD16等免疫标志物及信号分子数据,筛选子痫前期、流产史相关的生物标志物
- 机器学习模型训练: 利用标注的标签和协变量数据,训练早产风险预测或免疫细胞分型模型
- 免疫细胞亚群分析: 通过单细胞维度特征,研究早产女性免疫细胞亚群的分布及功能变化