数据集概述
本数据集基于RAEFISH技术构建,包含在完整组织中以分子分辨率进行的无测序全基因组空间转录组数据。覆盖人类约两万三千个、小鼠约两万两千个转录本,可揭示转录本亚细胞定位、细胞类型特异性转录组及细胞间相互作用的基因程序。
文件详解
该数据集按组织类型和技术类型分类存储,均为MATLAB数据格式(.mat),具体如下:
- 肝脏组织数据(位于Datasets/Liver/目录下):
- CopyNumber_241017.mat、CopyNumber_250327.mat:拷贝数数据文件
- RNACopyNumberMatrix_2Combine.mat:合并的RNA拷贝数矩阵
- CellList_NoCounts_2Combine_withAnnotation.mat:带注释的细胞列表文件(无计数)
- 淋巴结组织数据(位于Datasets/LymphNode/目录下):
- CopyNumber_241206.mat、CopyNumber_250317_Rep2.mat:拷贝数数据文件
- RNACopyNumberMatrix_2Combine.mat:合并的RNA拷贝数矩阵
- CellList_NoCounts_2Combine_withAnnotation.mat:带注释的细胞列表文件(无计数)
- 胎盘组织数据(位于Datasets/Placenta/目录下):
- CopyNumber_250308.mat、CopyNumber_241124.mat:拷贝数数据文件
- RNACopyNumberMatrix_2Combine.mat:合并的RNA拷贝数矩阵
- CellList_NoCounts_2Combine_withAnnotation.mat:带注释的细胞列表文件(无计数)
- A549细胞系MERFISH技术数据(位于Datasets/A549/MERFISH/目录下):
- Codebook.mat:编码本文件
- CellList_Rep1.mat、CellList_Rep2.mat:重复实验的细胞列表文件
- A549细胞系RAEFISH技术数据(位于Datasets/A549/RAEFISH/目录下):
- CopyNumber_250312.mat、CopyNumber_250317.mat:拷贝数数据文件
- CellListAll_250312.mat、CellListAll_250317.mat:全细胞列表文件
- Codebook_StevenRaeFISH23K_LabA549.mat:RAEFISH技术的编码本文件
适用场景
- 空间转录组学研究:分析转录本的亚细胞定位及组织空间分布特征
- 细胞生物学研究:探究细胞类型特异性及区域依赖性转录组特征
- 分子生物学研究:解析细胞间相互作用的基因程序机制
- 生物医学应用:支持高覆盖率、高分辨率的RNA空间分析研究
- CRISPR筛选研究:辅助基于图像的高内涵CRISPR筛选中gRNA的空间读取分析