阿拉伯语假新闻与真新闻文章数据集-shyakanobledavid

阿拉伯语假新闻与真新闻文章数据集-shyakanobledavid 数据来源:互联网公开数据
标签:阿拉伯语,假新闻,真新闻,新闻,文本分析,机器学习,数据预处理

数据概述: 本数据集由多个流行的阿拉伯语新闻网站抓取,包括Misbar(https://misbar.com/)、No Rumors(http://norumors.net/)、Verify-Sy(https://verify-sy.com/)和Fatabyyano(https://fatabyyano.net/)。数据集包含标记为假新闻或真新闻的阿拉伯语新闻文章。数据预处理步骤包括文本清理、分词和划分训练集和测试集。

数据集字段包括: - Article_content:阿拉伯语新闻文章正文。 - Topic:新闻主题。 - Label:新闻的真实性(假或真)。

数据用途概述: 该数据集适用于新闻真实性验证、假新闻检测、文本分类和自然语言处理等研究领域。研究人员可以利用此数据集训练和评估机器学习模型,以区分假新闻和真新闻。此外,数据集也可以用于新闻媒体教育和公众新闻素养提升。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 8.25 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。