数据集

社交媒体仇恨言论识别数据集-文本内容-2017

社交媒体仇恨言论识别数据集-文本内容-2017 数据来源：互联网公开数据标签：仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言数据概述：本数据集包含近1.5万条短文本，每条文本均由多位贡献者进行标注，以识别其是否包含仇恨言论。标注结果分为三类：a) 包含仇恨言论；b) 具有攻击性，但不属于仇恨言论；c) 完全没有攻击性。该数据集由Thomas Davidson、Dana Warmsley、Michael Macy和Ingmar Weber于2017年发布，用于研究自动化仇恨言论检测和攻击性语言问题。数据用途概述：该数据集主要用于训练和评估仇恨言论检测模型，以及研究社交媒体上的攻击性语言特征。可应用于自然语言处理、情感分析、文本分类等领域。研究人员可以使用该数据集开发算法，自动识别社交媒体内容中的仇恨言论，从而促进网络环境的净化。此外，该数据集也可用于教育和培训，帮助人们更好地理解仇恨言论的定义和表现形式。

数据与资源

社交媒体仇恨言论识别数据集-文本内容-2017.zipZIP
1.00 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	1.0 MiB
最后更新	2025年4月14日
创建于	2025年4月14日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

社交媒体仇恨言论识别数据集-文本内容-2017

数据与资源

附加信息

注册成功！