数据集概述
本数据集为Cellosaurus第50版的归档数据,由瑞士生物信息学研究所CALIPHO组提供。包含细胞系信息的结构化数据文件、参考文献、版本说明等11个文件,覆盖细胞系基础信息、交叉引用、删除记录等内容,是生物医学领域细胞系研究的重要参考资源。
文件详解
- 核心数据文件
- 文件名称:cellosaurus.obo、cellosaurus.xml
- 文件格式:OBO、XML
- 字段映射介绍:包含细胞系的标准化信息,如细胞系ID、名称、属性等结构化数据
- 辅助说明文件
- 文件名称:cellosaurus_relnotes.txt、cellosaurus_deleted_ACs.txt
- 文件格式:TXT
- 字段映射介绍:记录版本更新说明、已删除细胞系访问码等管理信息
- 交叉引用与参考文献文件
- 文件名称:cellosaurus_xrefs.txt、cellosaurus_refs.txt、cellopub.txt
- 文件格式:TXT
- 字段映射介绍:提供细胞系相关的外部数据库交叉引用、参考文献及出版物信息
- schema定义文件
- 文件名称:cellosaurus.xsd
- 文件格式:XSD
- 字段映射介绍:定义XML数据文件的结构规范
数据来源
瑞士生物信息学研究所(SIB)CALIPHO组
适用场景
- 细胞系信息检索与验证:用于查询细胞系的标准化属性、交叉引用及历史变更记录
- 生物医学研究支撑:为细胞实验设计、细胞系溯源提供权威数据参考
- 数据库整合与构建:作为基础数据源支撑生物医学数据库的交叉整合与扩展
- 细胞系研究文献关联:通过参考文献文件链接细胞系相关的学术出版物与研究成果