新闻真伪辨别数据集-标题文本与标签-2024-amirmotefaker

新闻真伪辨别数据集-标题文本与标签-2024-amirmotefaker 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分析,自然语言处理,机器学习,文本分类,标题,文本

数据概述: 本数据集旨在用于新闻真伪辨别研究与实践,包含了大量新闻标题、正文文本及对应的真伪标签。 数据集共包含7796条新闻样本,每条样本由四个字段构成:

  • identifies:新闻的唯一标识符。
  • title:新闻标题。
  • text:新闻正文。
  • label:新闻的真伪标签,取值为"REAL"(真实新闻)或"FAKE"(虚假新闻)。

数据集总大小约为30.7MB,数据按月度进行组织,方便按时间维度进行分析。

数据用途概述: 该数据集适用于多种与新闻真伪相关的研究与应用场景,包括但不限于:

  • 文本分类模型训练: 用于训练机器学习模型,实现自动识别新闻真伪。
  • 自然语言处理研究: 探索文本特征、语义分析等技术在新闻真伪检测中的应用。
  • 假新闻传播分析: 研究假新闻的传播模式、影响因素等。
  • 舆情监测与预警: 构建新闻真伪监测系统,及时发现并预警虚假信息。
  • 教育与科普: 作为教学案例,帮助学习者理解新闻真伪识别的技术与方法。
packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 11.33 MiB
最后更新 2025年4月21日
创建于 2025年4月21日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。