Ooh_Na_Na_生物学物种样本分类数据

数据集概述

本数据集包含生物学领域的物种相关数据,涵盖物种分类、样本信息及元数据等内容。数据以.tsv、.json和.gz格式存储,共4个文件,无目录层级结构,未区分训练/测试、数据/标签或原始/处理数据,主要用于物种分类相关的生物研究与分析。

文件详解

  • species_metadata.json
  • 文件格式:JSON
  • 字段映射介绍:包含版本(version)、Git哈希值(git_hash)、日期(date)、计数(count)等元数据字段
  • species_summary.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含uniprot、mgi、zfin、rgd、hgnc等多个数据库对应的物种标识数量统计字段
  • species_sample.tsv
  • 文件格式:TSV
  • 字段映射介绍:包含prefix(前缀)、identifier(标识符)、species(物种,对应NCBI分类号)三个核心字段
  • species.tsv.gz
  • 文件格式:TSV.GZ
  • 字段映射介绍:压缩格式的TSV文件,推测包含物种分类相关的详细数据

适用场景

  • 生物物种分类研究: 利用物种标识与NCBI分类号的映射关系,开展物种分类体系分析
  • 生物样本数据整合: 结合样本信息与物种分类数据,支持多数据库物种数据的交叉验证
  • 生物实验数据管理: 通过元数据记录实验版本、日期等信息,辅助生物实验数据的溯源与管理
  • 生物信息学数据库关联: 基于不同数据库(如uniprot、hgnc)的物种数量统计,分析跨数据库的物种数据覆盖度
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.42 MiB
最后更新 2026年2月2日
创建于 2026年2月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。