数据集

政治新闻事实核查与谎言检测数据集PoliticalNewsFact-CheckingandLieDetectionDataset-feyddautha

数据来源：互联网公开数据

标签：事实核查, 谎言检测, 政治新闻, 文本分析, 自然语言处理, 机器学习, 声明评估, 语料库

数据概述：该数据集包含来自政治新闻领域的事实核查信息，记录了政治人物的声明及其真实性评估结果。主要特征如下：时间跨度：数据未明确标明具体时间范围，但包含日期信息，反映了政治声明的时间背景。地理范围：数据主要聚焦于政治新闻，未明确限定地理范围，但可能侧重于特定国家或地区的政治事件。数据维度：数据集包含多个CSV文件，每个文件包含以下字段：id（唯一标识符），date（声明日期），speaker（声明者），statement（声明内容），sources（声明来源链接），paragraph_based_content（基于段落的内容），fullText_based_content（基于全文的内容），以及两个标签列（label_fnn和label-liar），分别对应不同的事实核查或谎言检测任务。数据格式：CSV格式，包含fnn_dev.csv, fnn_test.csv, fnn_train.csv, liar_dev.csv, liar_test.csv, liar_train.csv六个文件，每个文件包含声明文本、相关来源和标签信息，便于进行文本分析和模型训练。来源信息：数据集来源于对政治新闻声明的整理和标注，已进行结构化处理，方便分析。该数据集适合用于事实核查、谎言检测、声明真实性判断等研究，以及文本分类、自然语言处理等领域的应用。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于政治新闻分析、虚假信息检测、观点挖掘等学术研究，以及自然语言处理领域的文本分类、情感分析等研究。行业应用：为新闻媒体、社交平台提供事实核查工具的数据支持，帮助提升内容真实性和用户信任度；也可应用于舆情监控、风险管理等领域。决策支持：支持政府机构、非政府组织等在政策制定、公共宣传等方面做出更明智的决策，有效应对虚假信息带来的挑战。教育和培训：作为自然语言处理、人工智能、新闻传播等相关课程的实训材料，帮助学生和研究人员深入理解事实核查和谎言检测技术。此数据集特别适合用于探索声明内容与真实性之间的关系，构建自动化的事实核查系统，从而提升信息传播的透明度和可靠性。

数据与资源

versions_20250411111111.zipZIP
77.36 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	77.36 MiB
最后更新	2025年5月31日
创建于	2025年5月31日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

政治新闻事实核查与谎言检测数据集PoliticalNewsFact-CheckingandLieDetectionDataset-feyddautha

数据与资源

附加信息

注册成功！