社交媒体仇恨言论识别数据集-文本内容-2017

社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c) 完全没有攻击性。该数据集由Thomas Davidson、Dana Warmsley、Michael Macy和Ingmar Weber于2017年发布,用于研究自动化仇恨言论检测和攻击性语言问题。 数据用途概述: 该数据集主要用于训练和评估仇恨言论检测模型,以及研究社交媒体上的攻击性语言特征。可应用于自然语言处理、情感分析、文本分类等领域。研究人员可以使用该数据集开发算法,自动识别社交媒体内容中的仇恨言论,从而促进网络环境的净化。此外,该数据集也可用于教育和培训,帮助人们更好地理解仇恨言论的定义和表现形式。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 14, 2025, 21:59 (UTC)
创建于 四月 14, 2025, 21:59 (UTC)