找到133个数据集

标签: 验证集

过滤结果
  • 互变异构体对_cheminformatics_处理及_QSAR_QSPR_建模影响研究数据集

    2025年12月18日 30 108 97

    数据集概述 本数据集为研究互变异构体对化学信息学处理及QSAR/QSPR建模影响的补充材料,包含互变异构体生成、指纹计算、模型应用与构建相关的多类型文件,支持探索互变异构体对建模全流程的作用。 文件详解 互变异构体生成文件: methimazole_tautomers.smi:SMI格式,含甲巯咪唑的互变异构体SMILES线性表示 指纹计算结果文件:...
    packageimg
  • BioDCASE2025任务3生物声学微型硬件开发数据集

    2025年12月16日 30 88 41

    数据集概述 本数据集是BioDCASE 2025任务3的开发集,包含约2小时37分钟的音频记录,核心为黄鹀鸣声在不同环境、距离下的回放与原录音,以及其他物种鸣声和背景噪声的负样本,按训练集、验证集分类存储。 文件详解 根目录文件: Development_Set.zip:压缩包,包含训练集与验证集的音频文件...
    packageimg
  • 阿拉伯语语音命令数据集

    2025年12月16日 30 42 9

    数据集概述 该数据集包含12000条阿拉伯语语音命令数据对(语音信号与对应关键词),覆盖40个关键词,每个关键词300条音频(30位参与者×10次录制)。音频为1秒时长、16kHz采样率的WAV格式,另有独立背景噪声文件,适用于语音识别领域的关键词检测任务。 文件详解 主数据压缩包: 文件名称: abdulkaderghandoura/arabic-...
    packageimg
  • 陆生哺乳动物地震脚步声识别数据集

    2025年12月15日 30 87 75

    数据集概述 本数据集包含北美四种陆生哺乳动物(黑熊、美洲狮、灰狼、白尾鹿)的地震脚步声录音,数据于大温哥华动物园采集,经处理后用于训练卷积神经网络模型进行物种识别。 文件详解 文件名称: dataset-audio.zip 文件格式: ZIP (.zip) 文件内容:...
    packageimg
  • LivingNER标准语料库_物种病原体食物命名实体识别与分类数据集

    2025年12月15日 30 176 6

    数据集概述 该数据集为LivingNER标准语料库,包含训练、验证、测试及背景集,覆盖多医学专科的两千份临床病例报告,标注物种、病原体、人类及食物等实体,并提供多语言资源,用于命名实体识别、归一化及分类任务。 文件详解 核心压缩文件: livingner-...
    packageimg
  • 太阳日冕亮前沿分割与跟踪预训练模型

    2025年12月15日 30 50 18

    数据集概述 本数据集提供基于U-NET架构的预训练模型,用于从太阳动力学天文台(SDO)AIA基差图像中分割和跟踪日冕亮前沿,包含强度阈值处理后的验证集及预测特征掩码样本,同时附带有命令行Python工具。 文件详解 文件名称: helios_cnn-_Release_2.zip 文件格式: ZIP压缩包 文件内容:...
    packageimg
  • 单作者手写删除线数据集

    2025年12月15日 30 119 14

    数据集概述 该数据集包含单作者手写文字的清洁版与删除线版配对图像,文字内容取自《德古拉》片段,删除线类型涵盖横线、对角线等七种。数据按删除线类型均衡分为训练、验证、测试子集,支持手写删除线去除任务研究。 文件详解 压缩文件: train.zip:训练集压缩文件,包含训练用的手写文字图像对及对应CSV文件...
    packageimg
  • 碳纳米管限制碳炔的非谐效应与振动特性相互作用数据集

    2025年12月15日 30 167 48

    数据集概述 该数据集为研究碳纳米管限制下碳炔的非谐效应与振动特性相互作用的代码数据,包含GAP势函数训练、验证数据及评估代码,支持相关计算模拟分析。 文件详解 目录及内容: gap_global目录:含训练集、验证集、全局GAP势函数文件gap.xml(最后一行打印GAP拟合输入文件)...
    packageimg
  • 能源话题地理社交媒体文本分类数据集

    2025年12月15日 30 139 65

    数据集概述 本数据集围绕能源话题的地理社交媒体文本分类研究,包含标注的推特数据集、验证集、交互式可视化地图、地理数据文件及分析代码,支持通过自然语言处理技术分析公众对化石燃料、核能及可再生能源的立场。 文件详解 标注数据集: labeled_datasets.zip:...
    packageimg
  • 火星科学实验室好奇号漫游车科学与工程类别图像数据集

    2025年12月14日 30 189 52

    数据集概述 本数据集包含火星科学实验室(MSL)好奇号漫游车通过3台仪器拍摄的6820张图像,标注为19个科学与工程相关类别,按火星日范围划分为训练、验证和测试集,所有图像均调整为227×227像素。 文件详解 该数据集核心文件为压缩包 msl-labeled-data-set-v2.1.zip,内部包含以下内容: - 目录与文件: - images...
    packageimg
  • 国际象棋棋子图像分类数据集

    2025年12月14日 30 100 16

    数据集概述 本数据集为用于图像分类任务的国际象棋棋子图像数据集,包含四套不同的国际象棋棋子,其中三套用于训练,剩余一套用于验证。所有棋子由固定的俯视摄像头从棋盘的64个方格拍摄,覆盖棋子的所有角度,为图像分类模型训练提供多角度图像数据支持。 文件详解 文件名称: chess_pieces.zip 文件格式: ZIP (.zip) 内容说明:...
    packageimg
  • 波士顿新生儿缺氧缺血性脑病脑损伤数据集第一部分_2023

    2025年12月14日 30 77 33

    数据集概述 本数据集是首个公开的新生儿缺氧缺血性脑病(HIE)脑损伤数据集,包含一百三十三名HIE患儿的弥散MRI影像及专家标注的病灶数据。HIE病灶多为弥漫性小病灶(超半数患者病灶占脑体积不足百分之一),其分割任务比脑肿瘤等局灶性大病灶更具挑战性,旨在推动HIE及小弥散病灶MRI分割方法的发展。 文件详解 文件名称:Readme 文件格式:无扩展名...
    packageimg
  • 捷克波西米亚历史文献转录超级模型数据集2024

    2025年12月14日 30 150 4

    数据集概述 该数据集记录了2024年学生资助竞赛(SGS)项目中,学生团队基于Transkribus平台开发的捷克历史文献转录模型成果。包含训练集、验证集的错误率数据,多个学生开发的转录模型(如Finale 2.0、Agreg-8)及其字符错误率(CER),以及最终聚合模型CZECH...
    packageimg
  • 草莓数字图像数据集_StrawDI

    2025年12月14日 30 205 62

    数据集概述 该数据集包含西班牙韦尔瓦省20个种植园的8000张草莓图像,采集于2018年12月至2019年5月采摘季,覆盖约150公顷区域。图像在真实生产条件下拍摄,包含不同亮度环境、固定距离高度角度的JPEG格式图像,分辨率4032x3024。 文件详解 文件名称:StrawDI_The Strawberry Digital Images Data...
    packageimg
  • 提格利尼亚语语言建模数据集TLMD_v1_0_0

    2025年12月13日 30 110 41

    数据集概述 该数据集是为提格利尼亚语语言建模构建的单语种数据集,是同类数据中规模最大的提格利尼亚语数据集。数据经轻量清理,包含训练集(百分之九十八)和验证集(百分之二),支持自然语言处理研究。 文件详解 文件名称: tlmd_v1.0.0.zip 文件格式: ZIP压缩包 数据结构:...
    packageimg
  • BIOMAT_CellNER语料库训练与验证集

    2025年12月4日 60 25 10

    数据集概述 该数据集包含BIOMAT-CellNER语料库的训练集(七百五十篇文档)和验证集(一百篇文档),聚焦生物材料领域科学文献中细胞实体(细胞类型、细胞系)的命名实体识别标注,支持相关NER模型开发。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称: BIOMAT-CellNER_Train_Set.zip - 文件格式:...
    packageimg
  • 实时手术工具检测轻量级YOLOv8变体数据集及源代码

    2025年12月13日 30 88 85

    数据集概述 该数据集包含用于实时手术工具检测的轻量级YOLOv8变体相关数据,涵盖带标注的手术工具图像帧及对应源代码,支持训练与评估,为医疗场景下的实时目标检测研究提供数据基础。 文件详解 文件名称: code.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • 从语音到容器_文本转Docker数据集

    2025年12月13日 30 208 196

    数据集概述 该数据集包含三千一百九十二个不同的Docker命令样本,每个样本配有对应的自然语言描述(称为"prompt")。数据分为英语版本(含训练、验证、测试集)和西班牙语版本(仅测试集),以压缩包形式提供,为文本转Docker命令的研究提供数据支持。 文件详解 文件名称: data.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • BIOMAT_MONER语料库训练与验证集

    2025年12月13日 30 47 39

    数据集概述 该数据集为BIOMAT-MONER语料库的训练(750篇文档)与验证(100篇文档)集,用于生物材料领域科学文献中制造对象相关实体的命名实体识别(NER)模型开发,聚焦生物材料实验或应用中的制造对象及属性标注。 文件详解 文件名称: BIOMAT-MONER_Train_Set.zip 文件格式: .zip(压缩包) 内容说明:...
    packageimg
  • Tough_Tables实体链接评估数据集v3_0

    2025年12月13日 30 204 168

    数据集概述 该数据集是用于评估表格数据实体链接方法的基准数据集,支持CEA(单元格实体标注)和CTA(列类型标注)任务。v3.0版本适配DBpedia 2016-10和Wikidata 20220521知识图谱,按验证集和测试集划分,兼容SemTab 2019格式。 文件详解 文件名称: ToughTables-WD_v3.zip 文件格式:...
    packageimg