数据集概述
本数据集为ORCESTRA生成的gCSI数据对应的BioCompute Object(BCO),以JSON格式存储。包含BCO规范版本、ID、校验和、溯源、可用性、扩展、描述、执行、参数、输入输出及错误等11类核心域信息,用于标准化描述gCSI数据的生物计算过程与属性。
文件详解
- 文件名称:gCSI_2017_BCO.json
- 文件格式:JSON
- 字段映射介绍:包含11个顶级键值对,分别为:
- bco_spec_version:BCO规范版本
- bco_id:BCO唯一标识符
- checksum:数据校验和
- provenance_domain:溯源信息域
- usability_domain:可用性信息域
- extension_domain:扩展信息域
- description_domain:描述信息域
- execution_domain:执行信息域
- parametric_domain:参数信息域
- io_domain:输入输出信息域
- error_domain:错误信息域
数据来源
ORCESTRA(orcestra.ca)
适用场景
- 生物计算数据标准化管理:用于gCSI数据的生物计算过程规范化描述与共享
- 生物信息学数据溯源分析:通过provenance_domain追踪gCSI数据的生成与处理流程
- 生物计算工作流验证:基于execution_domain和parametric_domain验证计算过程的合规性
- 跨平台数据交换:利用BCO标准格式实现gCSI数据在不同生物信息平台间的互操作