找到3个数据集

标签: 社交媒体文本分析

过滤结果
  • 社交媒体多语言攻击性语言识别数据集2020_英文

    2025年12月7日 30 27 21

    数据集概述 该数据集为SemEval-2020 Task 12(OffensEval 2020)的英文部分数据,包含基于OLID schema的三个子任务测试集及相关文件,用于社交媒体攻击性语言识别,支持多语言任务的英文场景分析。 文件详解 说明文档: README.md:Markdown格式,介绍数据集背景、任务结构及文件说明,包含任务官网链接...
    packageimg
  • 数据2020年灾难推文语料库

    2025年12月7日 0 3 1

    数据集概述 该数据集包含2020年收集的、覆盖10类灾难共48起事件的推文数据,每条推文标注了是否与对应灾难相关。数据以平衡正负样本的文件形式组织,旨在为灾难相关推文过滤算法提供基准测试支持。 文件详解 文件名称:disaster-tweet-filtering-tranquil-tweets.zip 文件格式:ZIP压缩包...
    packageimg
  • 欧洲右翼及极右翼政治移民推文语料库2011_2022

    2025年12月4日 30 208 1

    数据集概述 本数据集是多语言移民主题推文语料库,聚焦2011-2022年欧洲英、法两国右翼及极右翼政治人物与政党的移民相关言论,含法、英两个子语料库,共一万八千二百三十三条推文、五十三万三千一百九十八词,为研究数字移民话语提供支持。 文件详解 该数据集包含多个CSV和ZIP格式文件,具体说明如下: - 法国子语料库文件(FR-R-MIGR-...
    packageimg