印尼虚假新闻检测数据集

数据集概述

本数据集包含印尼语虚假新闻检测相关的标注数据与实验文档,涵盖不同规模的新闻文本、标注流程记录及朴素贝叶斯分类器的实验结果,为印尼语虚假新闻自动检测研究提供支持。

文件详解

  • 250 news with valid hoax label.csv:CSV格式文件,包含250条印尼语新闻文本及对应的“虚假/有效”标签
  • 250 news labelling process.xlsx:Excel格式文件,记录10个新闻主题的标注流程,由三位评审对新闻链接进行“虚假/有效”标注,最终标签通过投票确定
  • 250 news experiment documentation.xlsx:Excel格式文件,记录朴素贝叶斯分类器在该数据集上的实验文档,包含60-40、70-30、80-20三种训练测试划分比例的三次实验
  • 600 news with valid hoax label.csv:CSV格式文件,包含600条印尼语新闻文本及对应的“虚假/有效”标签
  • 600 news labelling process.xlsx:Excel格式文件,记录12个新闻主题的标注流程,由三位评审对新闻链接进行“虚假/有效”标注,最终标签通过投票确定

数据来源

IEEE Xplore(关联研究论文:I. Y. R. Pratiwi等,2017)

适用场景

  • 自然语言处理研究:用于印尼语虚假新闻文本分类模型的训练与验证
  • 虚假新闻检测算法评估:可基于标注数据测试不同分类算法(如朴素贝叶斯)的准确率、召回率等性能
  • 新闻标注方法论研究:分析多评审投票机制在虚假新闻标注中的应用效果
  • 信息传播研究:探究印尼语环境下虚假新闻的文本特征与传播规律
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.55 MiB
最后更新 2025年11月27日
创建于 2025年11月27日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。