印度尼西亚反论语料库数据集2023

印度尼西亚反论语料库数据集2023 数据来源:互联网公开数据 标签:反论,批判性思维,自然语言处理,众包数据,逻辑谬误,学术研究,文本分析 数据概述: 本数据集来源于《Riposte! 大型反论语料库》论文,由Paul Reisert、Benjamin Heinzerling、Naoya Inoue、Shun Kiyono和Kentaro Inui等学者合作完成,收录了超过18,000条反论样本。该数据集通过众包方式收集,针对微小水平的谬误性论点(即单一声明和前提对)进行反论生成,旨在促进自动反论生成技术的研究。数据集包含训练集、开发集和测试集,具体文件包括train.csv、dev.csv和test.csv,分别存放在topic和no_topic目录中。每条记录中,carg字段为众包工人生成的反论内容,工人首先识别论点中的逻辑谬误类型,然后生成相应的反论。 数据用途概述: 该数据集适用于自然语言处理、批判性思维研究、文本分析等多个领域。研究人员可以利用此数据集开发和评估自动反论生成模型;教育工作者可以将其用于教学和培训,提升学生的批判性思维能力;此外,数据集还适用于学术研究,帮助学者深入理解反论生成的机制和模式。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.46 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。