数据集 - 海数据

土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni

2025年5月19日 30 5 3

土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni 数据来源：互联网公开数据标签：文本分类, 情感分析, 冒犯性语言, 仇恨言论, 语言学, 自然语言处理, 机器翻译, 语料库数据概述：...

ZIP

社交媒体仇恨言论与冒犯性语言数据集-suchindrakumar057

2025年4月26日 30 62 12

社交媒体仇恨言论与冒犯性语言数据集-suchindrakumar057 数据来源：互联网公开数据标签：仇恨言论，冒犯性语言，社交媒体，文本分析，自然语言处理，情感分析，机器学习，语言学数据概述：该数据集包含来自社交媒体平台的文本数据，记录了用户发布的仇恨言论和冒犯性语言。主要特征如下：时间跨度：数据记录的时间范围不定，取决于数据抓取的时间段。...

ZIP

Jigsaw毒性评论标注数据集-评论毒性评估与分析

2025年4月20日 30 64 23

Jigsaw毒性评论标注数据集-评论毒性评估与分析数据来源：互联网公开数据标签：毒性评论,自然语言处理,文本分类,情感分析,仇恨言论,冒犯性语言,标注数据,社交媒体,机器学习数据概述：...

ZIP

来自X的仇恨言论和冒犯性语言数据集

2025年4月15日 30 144 37

来自X的仇恨言论和冒犯性语言数据集数据来源：互联网公开数据标签：仇恨言论,冒犯性语言,社交媒体数据,文本分析,自然语言处理,三元分类,数据清理数据概述：本数据集通过名为“Instant Data...

ZIP

巴西葡萄牙语冒犯性语言识别数据集

2025年4月15日 30 188 9

巴西葡萄牙语冒犯性语言识别数据集数据来源：互联网公开数据标签：冒犯性语言,巴西葡萄牙语,多任务注释,社交媒体,自然语言处理,文本分析,内容安全数据概述：...

ZIP

仇恨言论和冒犯性推文数据集

2025年4月14日 30 178 57

仇恨言论和冒犯性推文数据集数据来源：互联网公开数据标签：仇恨言论,冒犯性语言,社交媒体,推特,文本分析,自然语言处理,社会伦理数据概述：...

ZIP

冒犯性语言文本数据集（英文）

2024年11月9日 30 17 5

数据以CSV格式和pickled pandas数据框（Python 2.7）存储。 count = 编码每条推文的CrowdFlower用户数量（最小值为3，有时当CF判断推文不可靠时，会有更多用户编码一条推文）。 hate_speech = 判断推文为仇恨言论的CF用户数量。 offensive_language =...

text/csv

找到7个数据集

注册成功！