多语言仇恨言论分析数据集1963-2021

多语言仇恨言论分析数据集1963-2021 数据来源:互联网公开数据 标签:仇恨言论,多语言,法语,意大利语,西班牙语,俄语,土耳其语,英语,葡萄牙语,文本分析,自然语言处理 数据概述: 本数据集包含来自7种语言的仇恨言论语料库,包括法语、意大利语、西班牙语、俄语、土耳其语、英语和葡萄牙语。数据来源广泛,涵盖多个公开的在线资源和数据集。数据集经过初步的预处理步骤,如移除“RT”、用户名标签“@”和哈希标签。该数据集提供了多语言背景下仇恨言论的多样化样本,适合进行跨语言分析和研究。 数据用途概述: 该数据集适用于仇恨言论检测、自然语言处理、文本分析和跨语言研究等场景。研究人员可以利用此数据集开发和评估多语言仇恨言论检测模型;政策制定者可根据数据了解不同语言环境中仇恨言论的特点;教育机构可使用数据集进行相关课程的教学和研究。数据集也适合用于促进跨文化交流和理解,通过分析不同语言中的仇恨言论模式,推动构建更加包容的社会环境。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.93 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。