-
社交媒体多语言攻击性语言识别数据集2020_英文
2025年12月7日 30 45 39
数据集概述 该数据集为SemEval-2020 Task 12(OffensEval 2020)的英文部分数据,包含基于OLID schema的三个子任务测试集及相关文件,用于社交媒体攻击性语言识别,支持多语言任务的英文场景分析。 文件详解 说明文档: README.md:Markdown格式,介绍数据集背景、任务结构及文件说明,包含任务官网链接...
-
欧洲右翼及极右翼政治移民推文语料库2011_2022
2025年12月4日 30 80 22
数据集概述 本数据集是多语言移民主题推文语料库,聚焦2011-2022年欧洲英、法两国右翼及极右翼政治人物与政党的移民相关言论,含法、英两个子语料库,共一万八千二百三十三条推文、五十三万三千一百九十八词,为研究数字移民话语提供支持。 文件详解 该数据集包含多个CSV和ZIP格式文件,具体说明如下: - 法国子语料库文件(FR-R-MIGR-...



