找到607个数据集

格式: ZIP 标签: 训练数据

过滤结果
  • CDR_Based_碳移除协同效益挑战与局限证据映射分类法数据集

    2026年1月28日 30 156 19

    数据集概述 本数据集与论文“A taxonomy to map evidence on the co-benefits, challenges, and limits of carbon dioxide...
    packageimg
  • LAYA_问答系统训练验证数据集

    2026年2月12日 30 133 66

    数据集概述 本数据集为LAYA问答系统相关数据集,包含训练和验证两类数据文件,文件总数为3个,涵盖JSONL和XLSX两种格式,主要用于问答系统的训练与验证场景,无目录结构,未提供文件内容预览及说明文档。 文件详解 文件1 文件名称:validation.jsonl 文件格式:JSONL...
    packageimg
  • IGM_Based_变异致癌性分类数据

    2026年2月10日 30 102 47

    数据集概述 本数据集为IGM变异致癌性分类数据,通过Variation Categorizer工具整理而成,主要用于肿瘤学领域中变异致癌性的分类研究,包含一个文件。 文件详解 文件名称:IGM_Variant_Oncogenicity_Classifications.xlsx 文件格式:XLSX...
    packageimg
  • ModelA_医学CT实验统计模型数据

    2026年2月10日 30 157 141

    数据集概述 本数据集为Model A相关实验数据,包含五十个文件,无目录层级。文件类型以.csv为主,涵盖统计模型、医学CT实验相关的测试、训练数据及筛选结果等内容,涉及实验参数、筛选条件、统计结果等信息,可用于模型相关的实验分析与验证。 文件详解 数据文件(35个) 格式:.csv、.xls、.xlsx...
    packageimg
  • 碳纳米管地下迁移地球化学影响研究数据集

    2026年2月10日 30 124 119

    数据集概述 本数据集支持关于“地球化学对地下环境中碳纳米管迁移的影响:整合微流控、光谱诱导极化与机器学习”的研究,包含研究所需的结构化数据,用于分析地下环境中地球化学因素对碳纳米管迁移的作用机制。 文件详解 文件名称:manuscript_revised.xlsx 文件格式:XLSX...
    packageimg
  • 牡蛎形态测量数据_基于形态的物种鉴定研究

    2026年2月9日 30 62 10

    数据集概述 本数据集为牡蛎物种形态鉴定研究的补充材料,包含两种牡蛎的形态测量数据,用于支持基于形态学的牡蛎物种几何形态测量鉴定方法研究。数据集共包含1个文件,可辅助分析牡蛎形态特征与物种分类的关联。 文件详解 文件名称:oo_923793.xlsx 文件格式:XLSX...
    packageimg
  • ICPR_2020文本块分割竞赛新闻眼数据集

    2026年2月9日 30 160 14

    数据集概述 本数据集为ICPR 2020文本块分割竞赛专用数据,源自NewsEye项目,包含奥地利国家图书馆提供的19至20世纪德语历史报纸页面(部分二值化),涉及4种报纸标题。数据分为简单赛道(仅连续文本)和复杂赛道(含表格、图像等),各赛道含训练数据40页、测试数据10页,总计6个压缩文件。 文件详解 训练数据文件...
    packageimg
  • Healthcare_Based_医疗文章专业非专业分类研究数据

    2026年1月28日 30 199 172

    数据集概述 本数据集为医疗文章专业级分类研究而收集,包含标注为“专业”和“非专业”的医疗文章数据,以及实验验证所需的源代码,可用于医疗文本分类相关研究。 文件详解 readme.md 文件格式:MD 字段映射介绍:包含研究背景说明、Python版本要求(Python...
    packageimg
  • WWW2020_Based_Web表格新实体发现实验复现资源

    2026年2月8日 30 118 55

    数据集概述 本数据集是论文《Novel Entity Discovery from Web Tables》的实验复现资源,包含三个用于Web表格新实体发现、实体类型与提及解析的测试集,以及300万张表格的提及-实体、标题-属性对应关系数据,支持论文中实体链接、表格匹配、实体解析实验的复现。 文件详解 压缩包文件...
    packageimg
  • ESA_HERA_DART_行星防御挑战赛模拟光变曲线数据集

    2026年1月29日 30 123 39

    数据集概述 本数据集为“行星防御挑战赛”数据集,受欧洲空间局HERA任务启发,模拟NASA DART任务撞击后Didymos双星小行星系统的光变曲线测量数据。包含三百组撞击前后的光变曲线对,前两百组附β因子、主星J2值、次星轴比a/c等参数,后一百组需预测β因子和a/c,用于研究撞击动量传递与小行星参数关系。 文件详解...
    packageimg
  • Youtube_API_Based_社交媒体历史场景标题数据集

    2026年2月8日 30 95 11

    数据集概述 本数据集通过Youtube API获取,包含多种历史场景下的社交媒体标题数据。数据集结构简单,仅含一个JSON格式文件,无目录层级划分,未提供训练/测试、数据/标签或原始/处理数据的划分,也无README或内容预览文件。 文件详解 文件名称:youtube_collection.json 文件格式:JSON...
    packageimg
  • Touché23_Based_人类价值观论证识别数据集2023

    2026年1月28日 30 20 2

    数据集概述 本数据集为Touché/SemEval 2023 Task 4(ValueEval)任务专用,用于识别论证背后的人类价值观。基于Webis-ArgValues-22数据集构建,包含训练、验证、测试阶段的论证文本与对应标签数据,共27个文件,支持自然语言处理领域的价值观识别研究。 文件详解 数据文件(.tsv格式,共25个)...
    packageimg
  • Free_throw_Based_罚球心理程序训练数据

    2026年2月7日 30 113 18

    数据集概述 本数据集为罚球心理程序训练相关数据,包含7个文档文件,覆盖多个编号表格内容,未划分训练测试集、数据标签集或原始处理集,主要用于记录罚球心理程序训练的相关信息。 文件详解 文件名称:Table 1.docx、Table 2.docx、Table 3.docx、Table 4.docx、Table 5.docx、Table...
    packageimg
  • PPO_Based_强化学习优化愤怒管理比较分析数据集

    2026年2月7日 30 94 89

    数据集概述 本数据集为基于强化学习的愤怒管理优化研究相关数据,包含用于比较分析PPO算法(优化超参数)在愤怒管理应用中的实验数据,以及相关问卷文件,支持愤怒管理强化学习模型的训练与分析。 文件详解 压缩文件(archive_files) 文件名称:data_sets.zip、data_sets (1).zip 文件格式:ZIP...
    packageimg
  • NicheHazardQA_Based_问答系统数据集

    2026年2月7日 30 186 32

    数据集概述 本数据集为NicheHazardQA,包含一个JSON格式文件,未划分训练/测试集、数据/标签集及原始/处理数据集,无说明文档或内容预览,主要用于问答相关任务。 文件详解 数据文件 文件名称:NICHEHAZARDQA.json 文件格式:JSON 字段映射介绍:无可用内容预览,具体字段信息未提供 适用场景 问答系统开发:...
    packageimg
  • SemEval_2024_Task3_对话多模态情感原因分析数据集

    2026年2月6日 30 137 5

    数据集概述 本数据集为SemEval-2024 Task 3的竞赛数据,聚焦对话场景下的多模态情感原因分析,包含文本单模态(TECPE)和多模态(MECPE)两个子任务的训练与测试数据,用于提取对话中的情感-原因对,支持情感计算与自然语言处理相关研究。 文件详解 说明文档 文件名称:README.md 文件格式:MD...
    packageimg
  • Wikimedia_数学表达式去重列表数据

    2026年2月2日 30 153 95

    数据集概述 本数据集包含维基媒体所有项目(含维基百科)中使用的全部数学表达式的去重列表。数据以JSON格式存储,键为输入内容的MD5哈希值,值为从维基文本源中提取的数学表达式内容。数据集可用于数学表达式的标准化、知识图谱构建等场景,仅包含一个文件。 文件详解 文件名称:wmf_texvc_inputs.json 文件格式:JSON...
    packageimg
  • KWX_Based_arXiv学术文章关键词数据集

    2026年1月31日 30 154 60

    数据集概述 本数据集基于arXiv Dataset构建,核心内容为补充了关键词字段的学术文章数据,包含CSV和JSON两种格式的文件,总计2个文件,可用于学术文献的关键词分析与检索支持。 文件详解 CSV文件 文件名称:data.csv 文件格式:CSV...
    packageimg
  • DRIP_Based_软件需求文档段落需求提取数据集

    2026年1月31日 30 98 88

    数据集概述 本数据集为DRIP项目相关的软件需求文档数据集,包含近五年RE、ICSE、REFSQ、REJ会议及期刊的软件需求文档数据,共4个归档文件,用于从软件需求文档段落中提取单个需求的任务。 文件详解 训练数据文件 文件名称:trainData.gz 文件格式:.gz 字段映射介绍:未提供具体字段信息 标注数据文件 文件名称:annotation...
    packageimg
  • CFL_Based汉字构形特征与手写汉字易读性研究数据

    2026年1月31日 30 109 27

    数据集概述 本数据集围绕汉字构形特征与CFL(中文作为外语)初学者手写汉字易读性的关系展开,包含一份研究数据文件,可用于分析汉字结构特征对初学者手写汉字辨识度的影响。 文件详解 文件名称:Research Data.xlsx 文件格式:XLSX...
    packageimg