中东地区虚假信息识别数据集MiddleEastMisinformationIdentificationDataset-reemaaljbreen

中东地区虚假信息识别数据集MiddleEastMisinformationIdentificationDataset-reemaaljbreen

数据来源:互联网公开数据

标签:虚假信息, 事实核查, 文本分析, 社交媒体, 阿拉伯语, 谣言检测, 内容审核, 自然语言处理

数据概述: 该数据集包含来自事实核查机构的数据,记录了中东地区社交媒体上流传的虚假信息及其相关证据。主要特征如下: 时间跨度:数据记录的时间范围为2024年6月23日,为静态数据集。 地理范围:数据主要关注中东地区,包含与该地区相关的虚假信息案例。 数据维度:包括“ClaimID”(声明ID),“claim”(声明内容),“description”(声明描述),“source”(信息来源),“date”(发布日期),“source_label”(来源标签,如“fake”),“normalized_label”(标准化标签,布尔值,表示真实性),“source_category”(来源类别),“normalized_category”(标准化类别),“source_url”(来源链接),“claim_urls”(声明链接),“evidence_urls”(证据链接),“claim_type”(声明类型)等。 数据格式:CSV格式,包含AraFacts.csv和AraFacts_2.csv两个文件,便于分析和处理。 该数据集适合用于虚假信息检测、事实核查、谣言分析等研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于社交媒体信息真实性分析、谣言传播机制研究等学术研究。 行业应用:可以为内容审核、社交媒体平台提供数据支持,用于提升虚假信息检测的准确性和效率。 决策支持:支持政府机构和非政府组织进行信息治理和舆情监测。 教育和培训:作为自然语言处理、文本分析、信息安全等相关课程的实训材料,帮助学生了解虚假信息检测技术。 此数据集特别适合用于探索中东地区虚假信息的传播特点和规律,帮助用户构建有效的虚假信息检测模型。

数据与资源

附加信息

字段
版本 1.0
最后更新 五月 29, 2025, 20:03 (UTC)
创建于 五月 29, 2025, 20:03 (UTC)