找到1个数据集

格式: ZIP 标签: DravidianCodeMix

过滤结果
  • 达罗毗荼语混合文本情感分析与冒犯性语言识别数据集2020

    2025年12月21日 30 6 2

    数据集概述 该数据集为三种低资源达罗毗荼语(泰米尔语、卡纳达语、马拉雅拉姆语)与英语的混合社交媒体评论数据,包含六万余条YouTube评论,经人工标注用于情感分析和冒犯性语言识别,标注者间一致性较高,支持相关自然语言处理研究。 文件详解 文件名称: DravidianCodeMix-2020.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg