数据集

印度假新闻清理数据集2016-2021

印度假新闻清理数据集2016-2021 数据来源：互联网公开数据标签：假新闻,清理数据,新闻分析,机器学习,文本分析,数据清洗,新闻真实性验证数据概述：本数据集基于Kaggle上的假新闻数据集，进行了清理和预处理。数据集包含从2016年至2021年间收集的新闻文章，涵盖了真实的新闻和假新闻两类。数据经过清洗，去除了噪音和无关信息，确保了数据质量和可用性，便于进行进一步的分析和建模。数据用途概述：该数据集适用于假新闻识别、文本分析、机器学习模型训练等场景。研究人员可以利用此数据集开发和验证假新闻检测算法；媒体机构可以借助数据识别并纠正虚假信息；教育机构可以利用数据进行新闻真实性教育和培训。此外，数据集也适合用于研究新闻传播机制和公众认知偏差。致谢：感谢Kaggle社区提供的原始数据集，以及所有为数据收集和标注做出贡献的志愿者。本数据集的清理和预处理工作参考了相关文献，特此感谢以下研究： - Vosoughi, S., Roy, D., & Aral, S. (2018). The spread of true and false news online. Science, 359(6380), 1146-1151. 灵感：本数据集有望解决假新闻识别和传播机制研究中的关键问题。我们希望看到以下问题得到解答： - 什么样的新闻更容易被公众误传为真新闻？ - 假新闻的传播模式和真实新闻有何不同？ - 可以采用哪些方法和技术有效识别和抑制假新闻的传播？

数据与资源

印度假新闻清理数据集2016-2021.zipZIP
25.56 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	25.56 MiB
最后更新	2025年4月18日
创建于	2025年4月18日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

印度假新闻清理数据集2016-2021

数据与资源

附加信息

注册成功！