科学声明事实核查数据集-2022-thedevastator
数据来源:互联网公开数据
标签:科学声明,事实核查,信任度分析,情感分析,科学传播,数据标注,自然语言处理
数据概述:
科学声明事实核查数据集(SciFact)是一项宝贵的数据资源,旨在揭示科学声明的情感、事实核查和可信度方面的深入见解。该数据集包含1400条由专家撰写的科学声明,每条声明都配有一篇包含相关证据的摘要,并附有人工生成的结构化注释,其中包括标签和理由。这些数据为研究人员提供了探索科学交流细微差别的机会,帮助深入理解科学家如何通过准确的语言选择、有力的论据和启发性的图表表达他们的想法。
数据用途概述:
该数据集适用于多种研究场景,包括科学声明的情感分析、事实核查算法开发、以及预测模型训练以自动生成结构化证据注释等。研究人员可以利用该数据集来测量科学声明证据的可信度或准确性,开发用于核查科学声明的算法,并训练模型以自动标注声明和摘要中的证据。
数据集包含以下文件和字段:
corpus_train.csv:包含声明的标题、摘要和结构化注释。
claims_validation.csv:包含用于验证的专家声明。
claims_test.csv:包含用于测试的专家声明。
claims_train.csv:包含用于训练的专家声明。
每个声明和摘要都经过人工标注,提供了详细的标签和理由,便于研究人员获取有价值的见解。使用该数据集时,请务必引用原始作者和Huggingface Hub。