找到3个数据集

标签: 达罗毗荼语

过滤结果
  • DravLex_Based_达罗毗荼语词汇数据库首版数据_v1_0_0

    2026年1月22日 30 36 19

    数据集概述 本数据集为DravLex达罗毗荼语词汇数据库的首次发布版本,包含一个压缩文件,整体目录结构简洁,未划分训练/测试集、数据/标签集或原始/处理数据,无自述文件或内容预览,核心为达罗毗荼语词汇相关数据。 文件详解 压缩文件 文件名称:Verkerk/DravLex-v1.0.0.zip 文件格式:ZIP...
    packageimg
  • Kannada_Based情态意义故事板录音与ELAN标注数据集2023

    2026年1月21日 30 163 3

    数据集概述 本数据集包含达罗毗荼语系Kannada语言的录音资料,聚焦情态表达,基于《Tom and Mittens》和《Chore Girl》两个故事板制作。数据由音频文件及ELAN格式的转录、部分翻译和注释组成,是2023年杜塞尔多夫大学"城市语言田野调查"课程的成果,可用于Kannada情态语义及类型学研究。 文件详解...
    packageimg
  • 达罗毗荼语混合文本情感分析与冒犯性语言识别数据集2020

    2025年12月21日 30 95 48

    数据集概述 该数据集为三种低资源达罗毗荼语(泰米尔语、卡纳达语、马拉雅拉姆语)与英语的混合社交媒体评论数据,包含六万余条YouTube评论,经人工标注用于情感分析和冒犯性语言识别,标注者间一致性较高,支持相关自然语言处理研究。 文件详解 文件名称: DravidianCodeMix-2020.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg