政治新闻事实核查与谎言检测数据集PoliticalNewsFact-CheckingandLieDetectionDataset-feyddautha

政治新闻事实核查与谎言检测数据集PoliticalNewsFact-CheckingandLieDetectionDataset-feyddautha

数据来源:互联网公开数据

标签:事实核查, 谎言检测, 政治新闻, 文本分析, 自然语言处理, 机器学习, 声明评估, 语料库

数据概述: 该数据集包含来自政治新闻领域的事实核查信息,记录了政治人物的声明及其真实性评估结果。主要特征如下: 时间跨度:数据未明确标明具体时间范围,但包含日期信息,反映了政治声明的时间背景。 地理范围:数据主要聚焦于政治新闻,未明确限定地理范围,但可能侧重于特定国家或地区的政治事件。 数据维度:数据集包含多个CSV文件,每个文件包含以下字段:id(唯一标识符),date(声明日期),speaker(声明者),statement(声明内容),sources(声明来源链接),paragraph_based_content(基于段落的内容),fullText_based_content(基于全文的内容),以及两个标签列(label_fnn和label-liar),分别对应不同的事实核查或谎言检测任务。 数据格式:CSV格式,包含fnn_dev.csv, fnn_test.csv, fnn_train.csv, liar_dev.csv, liar_test.csv, liar_train.csv六个文件,每个文件包含声明文本、相关来源和标签信息,便于进行文本分析和模型训练。 来源信息:数据集来源于对政治新闻声明的整理和标注,已进行结构化处理,方便分析。 该数据集适合用于事实核查、谎言检测、声明真实性判断等研究,以及文本分类、自然语言处理等领域的应用。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于政治新闻分析、虚假信息检测、观点挖掘等学术研究,以及自然语言处理领域的文本分类、情感分析等研究。 行业应用:为新闻媒体、社交平台提供事实核查工具的数据支持,帮助提升内容真实性和用户信任度;也可应用于舆情监控、风险管理等领域。 决策支持:支持政府机构、非政府组织等在政策制定、公共宣传等方面做出更明智的决策,有效应对虚假信息带来的挑战。 教育和培训:作为自然语言处理、人工智能、新闻传播等相关课程的实训材料,帮助学生和研究人员深入理解事实核查和谎言检测技术。 此数据集特别适合用于探索声明内容与真实性之间的关系,构建自动化的事实核查系统,从而提升信息传播的透明度和可靠性。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 31, 2025, 04:24 (UTC)
创建于 五月 31, 2025, 04:24 (UTC)