数据集

孟加拉语虚假新闻数据集

孟加拉语虚假新闻数据集数据来源：互联网公开数据
标签：孟加拉语,虚假新闻检测,自然语言处理,数据分类,机器学习,低资源语言,信息真实性评估

数据概述：
本数据集为BanFakeNews-2.0，包含约47000条真实新闻（标记为1）和13000条人工标注的虚假新闻（标记为0）。数据集分为训练集、验证集和测试集，比例为70:15:15，分别命名为train_cleaned.csv、val_cleaned.csv和test_cleaned.csv。此外，还包括一个用于消融实验的外部测试集。

数据用途概述：
该数据集适用于孟加拉语虚假新闻检测的研究与开发。研究人员可利用此数据集开发和评估虚假新闻检测模型，特别是在低资源语言环境下的性能。开发者可基于数据集训练分类模型，实现新闻真实性的自动判断。此外，数据集还可用于学术研究，支持低资源语言环境下虚假新闻检测技术的创新与优化。

数据与资源

孟加拉语虚假新闻数据集.zipZIP
58.59 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	58.59 MiB
最后更新	2025年4月24日
创建于	2025年4月24日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

孟加拉语虚假新闻数据集

数据与资源

附加信息

注册成功！