找到15个数据集

标签: TSV文件

过滤结果
  • AlphaFold2蛋白质序列比对改进研究数据集

    2025年12月10日 30 105 69

    数据集概述 本数据集包含论文《Highly significant improvement of protein sequence alignments with AlphaFold2》的补充表格、图表及数据集压缩包,核心内容围绕AlphaFold2对蛋白质序列比对性能的提升展开,为生物信息学领域相关研究提供数据支持。 文件详解...
    packageimg
  • InVID_Project_InVID_Fake_Video_Based_虚假视频检测训练数据集

    2025年12月10日 30 132 93

    数据集概述 该数据集是InVID项目开发的小型已验证虚假视频语料库,包含五十九个视频的URL和元数据,记录了每个视频的虚假类型、原始来源及证明其为虚假的证据,旨在呈现现实世界中可能遇到的虚假视频类型。 文件详解 文件名称: Fake Video Corpus.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • MEDDOPROF西班牙语医疗文档职业检测标注数据集

    2025年12月10日 30 9 2

    数据集概述 该数据集为MEDDOPROF金标准语料库,包含一千八百四十四篇西班牙语临床案例,标注内容涉及职业、工作状态及活动等信息,采用brat标注工具格式存储,还包含职业提及与ESCO、SNOMED CT术语映射的TSV文件,支持职业健康领域的自然语言处理研究。 文件详解 该数据集包含多个目录和文件,具体说明如下: - 目录文件: -...
    packageimg
  • 神经母细胞瘤细胞系分化反应异质性数据集2024

    2025年12月10日 30 127 124

    数据集概述 本数据集为论文《Neuroblastoma cell lines display heterogeneity in differentiation responses》(Ferguson et al, 2024)的支撑数据,包含图2A-C、图3A-D的基础数据,以及扩展数据表S1(qRT-...
    packageimg
  • CodiEsp任务有效CIE10编码数据集

    2025年12月9日 30 111 85

    数据集概述 本数据集为CodiEsp任务提供2018版CIE10诊断与手术编码列表,包含西班牙语及部分英语描述,覆盖诊断编码(D)和手术编码(P),后者含第四轴编码,支持非英语临床案例的自动编码研究。 文件详解 压缩包文件:codiesp_codes.zip(ZIP格式),包含以下两个TSV文件 codiesp-...
    packageimg
  • IODP探险398航次GEODESC描述数据集

    2025年12月9日 30 78 69

    数据集概述 该数据集包含国际大洋发现计划(IODP)第398航次的GEODESC描述文件,记录了岩心材料的描述性数据,包括制表符分隔数据文件、元数据文件及汇总信息CSV文件,为岩心样本描述研究提供数据支持。 文件详解 文件名称: GEODESC-...
    packageimg
  • 机器学习元数据映射表2023

    2025年12月8日 30 209 21

    数据集概述 本数据集包含机器学习模型和训练数据集的元数据映射表(Crosswalks),由NFDI4DataScience黑客松活动生成,旨在基于schema.org构建机器学习元数据通用方案,为相关领域提供标准化元数据参考。 文件详解 文件名称:2023.11.23 Metadata for ML - ML dataset...
    packageimg
  • 研究者对数据出版与同行评审的看法数据集

    2025年12月8日 30 79 22

    数据集概述 本数据集基于对约250名科学与社会科学领域研究者的调查,聚焦其对数据出版的期望及相关评价需求,涵盖数据出版的可信度评估、影响力评价与学术声望提升等方面,为数据出版商提供实践参考。 文件详解 README.txt:文档文件,格式为TXT,说明数据集包含的文件信息,如调查回复、调查工具PDF及列名说明文件等。...
    packageimg
  • PanelAppRex_Based_基因面板数据标准化完整数据集

    2025年12月8日 30 99 47

    数据集概述 该数据集是PanelAppRex平台的基础数据,包含五万八千余条标准化基因-疾病面板关联数据,涉及NHS批准的诊断面板。数据涵盖基因标识符、疾病注释、遗传模式及文献支持,支持生物信息学流程集成,为基因组诊断和变异解读提供结构化资源。 文件详解 数据文件:...
    packageimg
  • 西班牙语COVID_19推文职业检测黄金标准标注数据集2021

    2025年12月6日 30 83 2

    数据集概述 本数据集包含一万条带黄金标准标注的西班牙语COVID-19推文,按训练集、验证集、测试集以六十比二十比二十比例划分,涵盖职业分类与命名实体识别两个子任务的标注数据,同时提供多格式文件及工具脚本,支持自然语言处理模型训练与评估。 文件详解 数据集为压缩包格式,包含两个子任务相关文件,具体说明如下: - subtask-1(职业分类子任务):...
    packageimg
  • 数字馆藏管理系统众包列表数据集2020

    2025年12月6日 30 8 5

    数据集概述 本数据集包含70个数字馆藏管理系统的详细信息,涵盖基本信息、管理考量、界面设计、技术参数及社会因素等维度。数据由Ashley Blewer发起并完成,2020年11月14日从谷歌表格导出,提供多格式文件及背景说明文档。 文件详解 背景说明文件: 文件名称:01_The Collection Management System...
    packageimg
  • IODP第397航次GEODESC描述文件数据集

    2025年12月6日 30 17 11

    数据集概述 该数据集包含国际大洋发现计划(IODP)第397航次的GEODESC描述文件,涵盖岩芯材料的描述性数据、元数据及汇总信息,支持对航次岩芯样本的结构化分析与管理。 文件详解 metadata.zip: ZIP格式压缩文件,包含描述性元数据文件 GEODESC-README.txt:...
    packageimg
  • 德国公共卫生_ARE_急性呼吸道感染门诊发病率全过程数据

    2025年12月5日 30 145 99

    数据集概述 该数据集提供德国急性呼吸道感染(ARE)的门诊咨询发病率数据,基于初级保健诊所网络每周计算每十万居民的就诊率,包含季节、周次、联邦州、年龄组等维度,用于评估疾病负担、监测流行病学趋势及制定预防策略。 文件详解 核心数据文件: ARE-...
    packageimg
  • Yard_et_al辐射细胞系数据集

    2025年12月5日 30 66 50

    数据集概述 该数据集包含Yard等人研究中的辐射相关细胞系数据,涉及细胞系的辐射敏感性指标及表达矩阵信息,为辐射生物学领域的细胞系研究提供基础数据支持。 文件详解 文件名称: Yard_et_al_expression_matrix_meta.tsv,文件格式: TSV 字段映射: CellLine: 细胞系名称 AUC_published:...
    packageimg
  • DisTEMIST西班牙语临床病例疾病提及检测与标准化数据集

    2025年12月4日 30 189 134

    数据集概述 本数据集为DisTEMIST语料库,包含一千份西班牙语临床病例,病例中的疾病提及经人工标注并映射至SNOMED-CT概念。数据集分为训练集、测试集、背景集,同时提供多语言资源和跨术语映射文件,支持疾病实体检测与标准化相关研究。 文件详解 数据集以压缩包形式提供,核心内容包含以下目录与文件: - 主文件: -...
    packageimg