斯诺普斯新闻事实核查公众评论数据集-ambityga
数据来源:互联网公开数据
标签:事实核查,新闻,评论,真伪辨别,谣言,社交媒体,舆情分析,斯诺普斯,Snopes
数据概述:
本数据集来源于斯诺普斯(Snopes.com)网站上的事实核查内容,旨在提供一个关于新闻事实核查和公众评论的综合性数据集。数据集包含8个关键要素,记录了新闻事实的标题、公众评论、对评论的声明、事实核查的结论(真、假、误导等)、新闻来源、新闻内容的摘要。
数据集的具体字段包括:
问题(Question):新闻或事实的标题。
评论(Comment):公众对该新闻事实的简短评论。
声明(Claim):支持该评论的声明。
评级(Rate):新闻事实的真伪标签,如“真实”、“虚假”、“误导”等。
来源(Origin):新闻内容的完整内容。
摘要(summary):新闻内容的简短版本。
依赖于标签的特征:
真实内容(What's True):关于该新闻事实的真实内容。
虚假内容(What's False):关于该新闻事实的虚假内容。
未知内容(What's Unknown):关于该新闻事实的未知内容。
数据用途概述:
该数据集适用于多种研究和应用场景,包括:谣言检测、舆情分析、新闻真伪辨别、社交媒体内容分析、自然语言处理模型训练等。研究人员可以利用此数据分析公众对新闻事实的反应,评估事实核查的有效性,训练用于自动识别虚假信息的模型。此外,该数据集也适用于新闻学、传播学等领域的教学和研究,帮助学生了解新闻事实核查的流程和重要性。