-
Ooh_Na_Na_术语定义数据集
2026年2月15日 30 190 159
数据集概述 本数据集为Ooh Na Na Definitions的术语定义数据,包含以TSV格式存储的前缀-标识符-定义字符串,采用Python CSV模块引用格式。数据包含元数据、样本数据、摘要数据及压缩数据,共四个文件,可用于术语定义查询与标准化处理。 文件详解 文件名称:definitions_metadata.json 文件格式:JSON...
-
人类骨髓微环境年龄相关变化综合表征数据
2026年2月9日 30 67 41
数据集概述 本数据集围绕人类骨髓微环境的综合表征展开,重点关注其年龄相关变化。包含二十七份压缩文件和一份元数据文件,总计二十八份文件,未涉及训练测试、数据标签或原始处理数据的拆分,可用于骨髓微环境的年龄相关特征分析。 文件详解 压缩文件(archive_files)...
-
BFR2_策划的底栖有孔虫核糖体参考数据库
2026年2月1日 30 191 152
数据集概述 本数据集为底栖有孔虫核糖体参考数据库(BFR2),包含5,324条底栖有孔虫18S rDNA参考序列及对应的元数据。数据覆盖分类学信息、采样详情、序列来源等内容,是研究底栖有孔虫分类与分布的标准化参考资源,总计包含3个文件。 文件详解 序列文件 文件名称:BFR2_v1.2_full_sequence.fasta 文件格式:FASTA...
-
Ooh_Na_Na_生物学物种样本分类数据
2026年2月2日 30 10 0
数据集概述 本数据集包含生物学领域的物种相关数据,涵盖物种分类、样本信息及元数据等内容。数据以.tsv、.json和.gz格式存储,共4个文件,无目录层级结构,未区分训练/测试、数据/标签或原始/处理数据,主要用于物种分类相关的生物研究与分析。 文件详解 species_metadata.json 文件格式:JSON...
-
R_Based生物实验原始与处理数据文件集
2026年2月1日 30 140 103
数据集概述 本数据集为R脚本输入的生物实验相关数据,包含十二份文件,涵盖原始数据与处理后数据,涉及物种、样本、多样性等生物学实验要素,主要文件格式为.xlsx和.tsv,用于生物实验数据分析场景。 文件详解 数据文件组(共12份)...
-
sager_package_test_data
2026年2月1日 30 78 32
数据集概述 本数据集是sager包使用的测试数据文件集,包含经过处理的生物样本分析文件,如mzML格式的质谱数据文件、TSV格式的定量和鉴定结果文件,以及JSON格式的配置文件。数据可通过sagerData()函数下载、缓存和获取,版本更新涉及文件子集优化和格式调整,总计包含6个文件。 文件详解 mzML数据文件(3个)...
-
IBD_Based_欧亚已发表个体IBD片段检测数据
2026年1月31日 30 57 15
数据集概述 本数据集包含4,248名已发表欧亚个体的同源相同(IBD)片段数据,数据来源于论文“Accurate detection of identity-by-descent segments in human ancient DNA”,可用于研究欧亚人群的遗传关联与演化关系,总计包含一个压缩文件。 文件详解...
-
raw_data_Based_生物学原始实验数据文件集
2026年1月30日 30 75 37
数据集概述 本数据集为生物学领域的原始实验数据文件集,包含三十个文件,覆盖FASTA、PDB、TXT、CSV、TSV、XLSX、R等七种格式,涉及信号强度测量、序列比对、结构分析、数据处理脚本等内容,无明确目录结构,可用于生物信息学相关分析。 文件详解 数据文件类 信号强度测量文件:如Fig. S9Dand...
-
OMG_Based_混合模态基因组语言建模数据集附加文件
2026年1月30日 30 121 98
数据集概述 本数据集是论文“The OMG dataset: An Open MetaGenomic corpus for mixed-modality genomic language...
-
ISRD_Based_索尼机器人室内表面识别数据集2016
2026年1月30日 30 97 41
数据集概述 本数据集为室内表面识别数据集(ISRD),基于索尼ERS-7机器人的加速度计、红外测距、地面力和关节力传感器数据构建,包含30709个样本,覆盖木地板、短地毯、软/长毛地毯、乙烯基地板、瓷砖、铺地毯地板6类表面,每类样本量不同,对应明确类别标签。 文件详解...
-
EconBiz_Based_经济学学术图表文本提取图像数据集
2026年1月29日 30 83 41
数据集概述 本数据集是经济学领域的学术图表文本提取语料库,包含121张学术图表,随机抽取自EconBiz的288,000篇开放获取出版物。图表类型涵盖条形图、饼图、折线图、地图、散点图等,所有图表均经过人工标注形成黄金标准,用于评估文本提取工具。 文件详解 文件名称:EconBiz.zip 文件格式:ZIP...
-
Penion_Based_海洋海螺谱系识别与进化模式研究数据
2026年1月29日 30 135 45
数据集概述 本数据集围绕新西兰Penion海洋海螺展开,整合现存物种的遗传与贝壳形态变异数据,并结合化石分析谱系识别对进化模式的影响。数据验证了遗传与形态变异的一致性,发现部分分类过度拆分及化石标本错误归类问题,揭示谱系识别对进化模式认知的关键作用。 文件详解 遗传分析文件...
-
Ooh_Na_Na_OBO_Foundry替代标识符提取数据
2026年1月29日 30 194 158
数据集概述 本数据集为从OBO Foundry提取的替代标识符集合,包含前缀、主标识符和替代标识符三类信息,以TSV格式存储。数据集由pyobo工具生成,包含元数据、样本、摘要及压缩数据文件,可用于生物信息学领域的标识符映射与标准化研究。 文件详解 数据文件 文件名称:alts.tsv.gz 文件格式:gz压缩TSV...
-
iBOL_Based_植物DNA条形码数据2_00_6_00版本
2026年1月28日 30 73 0
数据集概述 本数据集为国际生命条形码项目(iBOL)发布的植物DNA条形码数据,包含2.00至6.00版本的17个压缩文件,涵盖不同阶段的植物DNA条形码信息,可用于植物物种鉴定与分类研究。 文件详解 压缩文件包...
-
HornMT_Based_非洲之角多语言机器翻译基准平行语料数据集
2026年1月27日 30 17 9
数据集概述 本数据集是针对非洲之角语言的机器翻译基准平行语料库,包含阿法尔语、阿姆哈拉语、英语、奥罗莫语、索马里语、提格雷尼亚语6种语言的新闻片段平行文本,以及每条文本对应的元数据(如新闻范围、类别、来源等),支持多语言机器翻译研究与系统开发。 文件详解 核心数据文件 目录名称:data/...
-
PanRes_Based_抗菌耐药基因整合数据库数据_v1_0_2
2026年1月27日 30 28 0
数据集概述 本数据集为PanRes抗菌耐药基因数据库,整合了ResFinder、CARD等多个已发表的抗菌耐药基因(ARGs)集合,形成统一的基因库。包含基因序列文件及注释表,提供基因的来源数据库、聚类信息等元数据,适用于宏基因组中耐药基因的大规模筛查与分析。 文件详解 README.md 文件格式:MD...
-
ARM_Based_GoAmazon实验气象数据日均值分析_数据集
2026年1月27日 30 2 0
数据集概述 本数据集基于2014-2015年Manacaparu地区T3气象站的分钟级数据,经预处理计算每日各变量均值得到。包含气象要素和气体浓度两类日均值数据,以及对应的元数据文件,总计4个文件,用于GoAmazon实验的数据分析与可视化。 文件详解 数据文件 文件名称:icos.tsv 文件格式:TSV...
-
ClinSpEn_CT_Based_平行英西生物医学术语数据_2022
2026年1月26日 30 114 85
数据集概述 本数据集为ClinSpEn-Clinical Terms子任务的样本、测试及背景数据,方向为西班牙语到英语(ES>EN)翻译。术语源自医学文献和临床记录,聚焦疾病、症状等类别,由专业医疗译者翻译修订,支持生物医学领域机器翻译系统开发与评估。 文件详解...
-
Biblical_Quotations_GT_圣经引文标注研究数据集
2026年1月25日 30 169 141
数据集概述 本数据集为“Aggadic文献中复杂引文模式自动检测”项目的研究数据,包含标注的圣经引文及相关模式数据,由海法大学团队构建。总计56个文件,含TSV格式的标注数据、JSON格式的关系层与标签集定义文件,用于支持宗教文本中圣经引文的自动识别与分析研究。 文件详解 TSV数据文件(50个)...
-
MacArthur_Based莺类生态位分化重新评估数据_进化框架分析
2026年1月22日 30 13 5
数据集概述 本数据集包含重新评估MacArthur莺类生态位分化的相关数据与代码,涉及莺类形态测量、觅食行为及粪便宏条形码饮食分析,结合系统发育框架研究物种竞争与生态位分化机制,共32个文件,涵盖原始数据、处理脚本及分析结果。 文件详解 数据文件...



