Webis_ConcluGen_Based_2021结论生成语料库_Patch1_0_1

数据集概述

本数据集为Webis-ConcluGen-2021结论生成语料库,包含约13万组论证文本与结论配对数据,分为base、topic、targets、aspects四种变体,每种变体含训练、验证、测试文件,还提供自动评估测试集与人工评估用测试集,便于定量与定性分析。

文件详解

  • 文件名称:webis-conclugen-2021.zip、webis-conclugen-2021-v1.0.1.zip
  • 文件格式:ZIP
  • 内容说明:包含四种语料变体(base、topic、targets、aspects)的训练/验证/测试文件,以及automatic_evaluation_test_set.csv(自动评估测试集)、manual_evaluation_arguments.csv(人工评估测试集);v1.0.1版本移除重复数据并重新索引ID,将论证文本与结论合并为单CSV文件便于加载。

适用场景

  • 自然语言处理_结论生成模型训练: 用于训练论证文本到结论的生成模型,优化文本摘要与逻辑结论输出能力。
  • 模型性能评估: 通过自动评估测试集进行定量指标测试,或用人工评估测试集开展定性对比分析。
  • 文本编码方式研究: 对比topic、targets、aspects等不同编码方式对结论生成效果的影响。
  • 论证文本处理研究: 分析论证文本的结构特征与结论生成的逻辑关联性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 441.61 MiB
最后更新 2026年1月13日
创建于 2026年1月13日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。