洋葱新闻数据集

洋葱新闻数据集 数据来源:互联网公开数据
标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性

数据概述:
本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The Onion》发布的文章被标记为1,而r/NotTheOnion上的文章被标记为0。数据集旨在用于文本分类任务,帮助区分假新闻和真实新闻。

数据用途概述:
该数据集适用于文本分类模型的训练和评估,尤其是在假新闻检测领域的研究。研究人员可以利用此数据集开发和测试机器学习算法,以提高新闻真实性的识别能力。此外,数据集也可以用于自然语言处理课程的教学,帮助学生理解文本分类的基本概念和技术。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.85 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。