ETHOS仇恨言论数据集

ETHOS仇恨言论数据集 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,多标签分类,二元分类,社会研究

数据概述: ETHOS仇恨言论数据集是一个用于社交媒体平台上仇恨言论检测的数据集,包含两个版本。Ethos_Dataset_Binary.csv包含998条评论,每条评论附带一个标签,标识是否包含仇恨言论,其中565条评论不含仇恨言论,433条评论含有仇恨言论。Ethos_Dataset_Multi_Label.csv则对其中433条包含仇恨言论的评论进行了多标签分类,包含暴力(是否煽动暴力1或0)、针对个人或群体(针对个人1或群体0)以及关于性别、种族、国籍、残疾、宗教和性取向六类仇恨言论的标签。

数据用途概述: 该数据集适用于仇恨言论检测、社交媒体监控、文本分析和多标签分类研究等多种场景。研究人员可以通过此数据集开发和评估仇恨言论检测算法,政府机构和社交媒体平台可利用数据识别和移除有害内容,促进健康的在线交流环境。此外,该数据集也适合用于教育培训,帮助学习者理解仇恨言论识别的技术和伦理问题。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 13:53 (UTC)
创建于 四月 14, 2025, 13:53 (UTC)