仇恨言论检测数据集

仇恨言论检测数据集

数据来源:互联网公开数据

标签:仇恨言论,图像分类,社交媒体分析,机器学习,深度学习,社会行为分析,内容审核

数据概述: 本数据集旨在支持仇恨言论检测的机器学习模型训练和评估,特别关注社交媒体平台上图像中的仇恨内容。数据集由图像文件和CSV格式的元数据组成,包含训练、测试和验证三个子集。图像文件存储在不同的目录中,每个图像对应一条文本描述和一个标签(分为“offensive”和“non-offensive”两类)。CSV文件记录了每个图像的唯一标识符、文本内容及其标签,为模型训练提供了结构化的标注数据。

数据用途概述: 该数据集适用于多种仇恨言论检测相关的研究和应用。研究人员可以利用此数据集训练多模态深度学习模型(如卷积神经网络),用于图像中的仇恨内容识别。同时,数据集可用于不同仇恨言论分类算法的性能基准测试,支持算法优化和模型比较。此外,该数据集可用于分析社交媒体上的仇恨言论趋势和模式,为理解在线仇恨行为提供数据支持。数据集还可用于开发内容审核工具和干预措施,以遏制仇恨言论的传播,促进网络文明。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 18, 2025, 03:56 (UTC)
创建于 四月 18, 2025, 03:51 (UTC)