找到7个数据集

标签: 训练文件

过滤结果
  • TopiOCQA_独立文件_问答任务训练验证数据集

    2026年1月31日 30 101 1

    数据集概述 本数据集为TopiOCQA数据集的独立文件,包含训练和验证两个JSON文件,无目录结构,文件类型统一为JSON格式,可用于问答相关任务的模型训练与验证。 文件详解 训练文件 文件名称:topiocqa_train.json 文件格式:JSON 字段映射介绍:未提供具体字段信息,推测包含问答任务训练所需的输入输出数据。 验证文件...
    packageimg
  • Phased_Logic_Dataset_Based训练数据文件集

    2026年1月27日 30 190 69

    数据集概述 本数据集为Phased Logic Dataset训练数据集,包含3个JSON格式的训练文件,无测试、标签或原始/处理数据的划分,无目录结构,文件命名无固定模式,未提供具体内容预览。 文件详解 训练文件 文件名称:train_1.json、train_3.json、train_2.json 文件格式:JSON...
    packageimg
  • ELMTEX_Based_临床报告结构化信息抽取大语言模型微调数据集

    2026年1月23日 30 41 21

    数据集概述 本数据集为ELMTEX项目相关论文配套数据,用于大语言模型在结构化临床信息抽取任务中的微调。包含英文和德文两种语言的训练与测试文件,总计四个JSON格式文件,无目录层级结构,文件类型统一为JSON格式。 文件详解 英文训练文件 文件名称:train_en.json 文件格式:JSON 字段映射介绍:用于大语言模型微调的英文临床报告训练数据...
    packageimg
  • Webis_ConcluGen_Based_2021结论生成语料库_Patch1_0_1

    2026年1月13日 30 200 170

    数据集概述 本数据集为Webis-ConcluGen-2021结论生成语料库,包含约13万组论证文本与结论配对数据,分为base、topic、targets、aspects四种变体,每种变体含训练、验证、测试文件,还提供自动评估测试集与人工评估用测试集,便于定量与定性分析。 文件详解 文件名称:webis-...
    packageimg
  • GBIF_Supporting_Data_ChatGPT_4分类数据转OWL实验数据_Version2

    2026年1月3日 30 49 40

    数据集概述 本数据集是论文“Exploring ChatGPT-4 for Transforming Taxonomic Data into OWL”的支持数据,包含使用ChatGPT-4、Gemini、DeepSeek等大模型将GBIF骨干分类数据转换为OWL本体的实验数据,涉及提示词、日志、训练文件及生成的本体文件等,共17个文件。 文件详解...
    packageimg
  • 语音增强的Open_Unmix权重数据集

    2025年12月20日 30 123 53

    数据集概述 本数据集包含基于Voicebank+Demand(二十八说话人版本)训练的Open-Unmix语音增强模型权重,采样率为一万六千赫兹。数据文件类型多样,可适配open-unmix-nnabla与open-unmix-pytorch框架使用。 文件详解 模型权重文件(.pth格式): noise_04a6fc2d.pth:噪声分离模型权重文件...
    packageimg
  • 谷歌天文识别云彩训练文件大小数据集

    2025年4月15日 30 46 39

    谷歌天文识别云彩训练文件大小数据集 数据来源:互联网公开数据 标签:谷歌挑战,云彩识别,训练文件,元数据,文件大小,记录ID,天文研究 数据概述:...
    packageimg