数据集概述
本数据集为Cellosaurus第52版归档数据,由瑞士生物信息学研究所(SIB)CALIPHO组提供,包含11个文件,涵盖细胞系核心数据、删除记录、参考文献、交叉引用等内容,支持生物医学领域细胞系相关研究与应用。
文件详解
- 核心数据文件
- 文件名称:cellosaurus.xml、cellosaurus.xsd、cellosaurus.obo
- 文件格式:XML、XSD、OBO
- 字段映射介绍:包含细胞系结构化数据(XML)、数据结构定义(XSD)、本体格式数据(OBO)
- 文本数据文件
- 文件名称:cellosaurus.txt、cellosaurus_deleted_ACs.txt、cellopub.txt、cellosaurus_refs.txt、cellosaurus_xrefs.txt
- 文件格式:TXT
- 字段映射介绍:包含细胞系文本数据、已删除细胞系访问码、出版物信息、参考文献、交叉引用信息
- 说明文件
- 文件名称:cellosaurus_faq.txt
- 文件格式:TXT
- 字段映射介绍:包含数据集使用常见问题解答
数据来源
瑞士生物信息学研究所(SIB)CALIPHO组
适用场景
- 细胞系信息检索:用于查询特定细胞系的基础信息、参考文献及交叉引用数据
- 生物医学研究:支持细胞系相关实验设计、数据验证与结果分析
- 数据库构建:为生物医学数据库提供细胞系标准化数据支撑
- 学术研究文献关联:通过cellopub.txt和cellosaurus_refs.txt关联细胞系相关学术出版物