CT_FAN多语言假新闻检测数据集2022

数据集概述

该数据集为多语言假新闻检测任务设计,包含2010-2022年英文和德文新闻文章,标注其真实性评级(假、部分假、真、其他)及主题领域,支持跨语言迁移学习研究,适用于构建多语言假新闻分类模型。

文件详解

  • 文件名称:FakeNews_Task3_2022.zip
  • 文件格式:ZIP压缩包
  • 内部数据字段:
  • ID:新闻文章唯一标识符
  • Title:新闻文章标题
  • Text:新闻文章正文内容
  • our rating:真实性评级(false/partially false/true/other)
  • domain:新闻主题领域

适用场景

  • 多语言假新闻检测模型训练与评估
  • 跨语言迁移学习在低资源语言(德语)任务中的应用研究
  • 新闻真实性评级算法的性能对比实验
  • 不同主题(如选举、COVID-19)假新闻特征分析
  • 假新闻检测领域的基准测试与方法验证
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 4.43 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。