真假新闻辨识文章数据集-2016至2017年-abkrishna05
数据来源:互联网公开数据
标签:假新闻,真新闻,新闻分类,文本分析,数据集,信息验证,机器学习,文本挖掘
数据概述:
本数据集包含2016年至2017年间收集的真假新闻文章数据,共分为两个文件:Fake.csv 和 True.csv。数据集每条记录代表一篇新闻文章,涵盖了文章标题、正文内容、主题分类以及发布日期等关键信息。该数据集旨在帮助研究者和开发者进行新闻真实性和可信度的自动识别和分类。
数据用途概述:
该数据集适用于假新闻检测、新闻分类、文本分析、机器学习模型训练等多个场景。研究人员可以使用此数据集开发和测试新闻真实性检测算法;媒体机构可以利用此数据集提高新闻内容的审核效率;教育机构可以将其作为教学资源,帮助学生了解新闻的真实性和信息验证的重要性。此外,该数据集还适合用于数据科学项目和竞赛,为参与者提供丰富的文本数据资源。
数据集包含以下字段:
- Title:文章标题
- Text:文章正文
- Subject:文章主题分类
- Date:文章发布日期
数据集来源:https://www.kaggle.com/datasets/clmentbisaillon/fake-and-real-news-dataset