数据集概述
本数据集包含论文“TP53 loss with whole genome doubling mediates heterogeneous intra-patient therapy response through Chromosomal Instability”的处理数据,涉及E/EP小鼠肿瘤和PC9耐药细胞系的拷贝数谱及相关分析数据,可支持肿瘤异质性与治疗响应机制研究,共含23个文件。
文件详解
- 核心数据文件
- 文件名称:cell.descriptions.csv
- 文件格式:CSV
- 字段映射介绍:包含cell.group(细胞组)、mouse(小鼠编号)、tx.status(治疗状态)、p53.status(p53状态)、somy(染色体数目)、cell(细胞编号)、GII/wGII(基因组不稳定性指数)、FLOH/wFLOH(杂合性缺失频率)等细胞描述字段
- 文件名称:PC9relativeCN.txt
- 文件格式:TXT
- 字段映射介绍:包含PC9细胞系样本编号(如S_PC9A15_SU_D9)的相对拷贝数数据
- 文件名称:PC9_Corrected_ploidies_4.11.2020.xlsx
- 文件格式:XLSX
- 字段映射介绍:PC9细胞系校正后的倍性数据
- 基因与突变数据文件
- 文件名称:drivermutations.txt
- 文件格式:TXT
- 字段映射介绍:驱动基因突变相关数据
- 文件名称:COSMIC_19_35_00_2021.tsv
- 文件格式:TSV
- 字段映射介绍:包含Gene Symbol(基因符号)、Genome Location(基因组位置)、Role in Cancer(癌症中的作用)等COSMIC数据库基因信息
- 压缩数据文件
- 文件名称:Mus_musculus.GRCm38.102.gtf.gz、PC9-losses-frequencies.tsv.gz、cells-copynumbers.tsv.gz等13个.gz文件
- 文件格式:GZ
- 字段映射介绍:包含小鼠基因组注释、PC9细胞拷贝数缺失频率、细胞拷贝数谱等压缩数据
数据来源
zaccaria-lab GitHub仓库(https://github.com/zaccaria-lab/TP53loss_WGD)
适用场景
- 肿瘤异质性机制研究:分析TP53缺失与全基因组加倍(WGD)介导的肿瘤内治疗响应异质性
- 染色体不稳定性分析:通过拷贝数谱数据研究染色体不稳定性对治疗响应的影响
- 耐药细胞系机制研究:利用PC9耐药细胞系数据探索肿瘤耐药的分子机制
- 生物信息学模型构建:基于单细胞拷贝数与细胞描述数据构建肿瘤治疗响应预测模型
- 基因功能关联分析:结合COSMIC数据库基因信息分析驱动基因在肿瘤治疗中的作用