找到6个数据集

标签: 代码混合

过滤结果
  • DISPLACE2024_Track3_Based_多语言对话ASR评估标签完整数据

    2025年12月11日 30 69 59

    数据集概述 该数据集为DISPLACE2024挑战赛的官方数据,包含多语言多说话人自然对话内容,涵盖代码混合/切换、自然重叠、混响及噪声等多样化特征。数据用于挑战赛的开发与评估,未提供训练数据,仅包含开发和评估用的自然对话数据集,支持参与者进行模型适配。 文件详解 文件名称:Track3_ASR_eval_segment_labels.zip...
    packageimg
  • 代码混合情感分析数据集CodeMixedSentimentAnalysisDataset-aswin037

    2025年4月24日 30 22 15

    代码混合情感分析数据集CodeMixedSentimentAnalysisDataset-aswin037 数据来源:互联网公开数据 标签:情感分析,代码混合,自然语言处理,社交媒体,数据集,机器学习,文本分析,跨语言研究 数据概述: 该数据集包含来自社交媒体平台的代码混合文本数据,记录了不同语言和代码混合的文本及其对应的情感标签。主要特征如下:...
    packageimg
  • 代码混合数据集CodeMixData-shankhad

    2025年4月22日 30 83 29

    代码混合数据集CodeMixData-shankhad 数据来源:互联网公开数据 标签:代码,编程,数据集,自然语言处理,机器学习,代码生成,多语言,软件工程 数据概述: 该数据集包含来自多种编程语言的代码片段和相关文本描述,旨在支持代码生成,代码理解和代码翻译等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要基于公开的代码库和文档。...
    packageimg
  • 孟加拉语-英语-印地语混合语言侮辱性语言识别数据集

    2025年4月15日 30 171 15

    孟加拉语-英语-印地语混合语言侮辱性语言识别数据集 数据来源:互联网公开数据 标签:侮辱性语言,代码混合,孟加拉语,英语,印地语,自然语言处理,文本分类,情感分析 数据概述:...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日 30 154 36

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • 达拉兹电商平台多语言产品评论数据集2023

    2025年4月14日 30 63 4

    达拉兹电商平台多语言产品评论数据集2023 数据来源:互联网公开数据 标签:电商平台,产品评论,多语言处理,情感分析,代码混合,消费者反馈 数据概述:...
    packageimg