数据集概述
本数据集为Touché 2020争议问题论点检索任务的数据,包含6个文件,涵盖任务主题、检索结果运行文件及相关性判断文件,支持自然语言处理领域中争议问题论点检索相关研究,文件类型以.zip和.qrels为主。
文件详解
- 主题文件
- 文件名称:
topics-task-1.zip
- 文件格式:ZIP
- 字段映射介绍:包含Touché 2020任务1的争议问题主题数据
- 检索结果运行文件
- 文件名称:
touche2020-task1-runs-args-me-corpus-version-2020-04-01.zip、touche2020-task1-runs-args-me-corpus-version-1.zip
- 文件格式:ZIP
- 字段映射介绍:分别对应基于args-me语料库不同版本的任务1检索结果运行数据
- 相关性判断文件
- 文件名称:
touche2020-task1-relevance-args-me-corpus-version-2020-04-01.qrels、touche2020-task1-relevance-args-me-corpus-version-2020-04-01-corrected.qrels、touche2020-task1-relevance-args-me-corpus-version-1.qrels
- 文件格式:QRELS
- 字段映射介绍:包含不同版本语料库下任务1的相关性判断数据,其中corrected文件为修正版
数据来源
Touché 2020 Argument Retrieval for Controversial Questions任务
适用场景
- 论点检索模型开发:用于训练和测试针对争议问题的论点检索算法,提升检索准确性
- 相关性判断研究:分析不同版本语料库下相关性判断的差异,优化判断标准
- 自然语言处理任务评估:作为基准数据集,评估NLP系统在争议问题论点检索任务中的性能
- 争议问题研究:通过主题数据和检索结果,分析争议问题的论点分布及特征