-
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni
2025年5月19日 30 12 3
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni 数据来源:互联网公开数据 标签:文本分类, 情感分析, 冒犯性语言, 仇恨言论, 语言学, 自然语言处理, 机器翻译, 语料库 数据概述:... -
社交媒体仇恨言论与冒犯性语言数据集-suchindrakumar057
2025年4月26日 30 17 1
社交媒体仇恨言论与冒犯性语言数据集-suchindrakumar057 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体,文本分析,自然语言处理,情感分析,机器学习,语言学 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用户发布的仇恨言论和冒犯性语言。主要特征如下: 时间跨度:数据记录的时间范围不定,取决于数据抓取的时间段。... -
Jigsaw毒性评论标注数据集-评论毒性评估与分析
2025年4月20日 30 18 8
Jigsaw毒性评论标注数据集-评论毒性评估与分析 数据来源:互联网公开数据 标签:毒性评论,自然语言处理,文本分类,情感分析,仇恨言论,冒犯性语言,标注数据,社交媒体,机器学习 数据概述:... -
来自X的仇恨言论和冒犯性语言数据集
2025年4月15日 30 30 1
来自X的仇恨言论和冒犯性语言数据集 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体数据,文本分析,自然语言处理,三元分类,数据清理 数据概述: 本数据集通过名为“Instant Data... -
巴西葡萄牙语冒犯性语言识别数据集
2025年4月15日 30 27 3
巴西葡萄牙语冒犯性语言识别数据集 数据来源:互联网公开数据 标签:冒犯性语言,巴西葡萄牙语,多任务注释,社交媒体,自然语言处理,文本分析,内容安全 数据概述:... -
仇恨言论和冒犯性推文数据集
2025年4月14日 30 27 3
仇恨言论和冒犯性推文数据集 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体,推特,文本分析,自然语言处理,社会伦理 数据概述:... -
冒犯性语言文本数据集(英文)
2024年11月9日 30 17 8
数据以CSV格式和pickled pandas数据框(Python 2.7)存储。 count = 编码每条推文的CrowdFlower用户数量(最小值为3,有时当CF判断推文不可靠时,会有更多用户编码一条推文)。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...