-
DISPLACE2024_Track3_Based_多语言对话ASR评估标签完整数据
2025年12月11日 30 69 59
数据集概述 该数据集为DISPLACE2024挑战赛的官方数据,包含多语言多说话人自然对话内容,涵盖代码混合/切换、自然重叠、混响及噪声等多样化特征。数据用于挑战赛的开发与评估,未提供训练数据,仅包含开发和评估用的自然对话数据集,支持参与者进行模型适配。 文件详解 文件名称:Track3_ASR_eval_segment_labels.zip...
-
代码混合情感分析数据集CodeMixedSentimentAnalysisDataset-aswin037
2025年4月24日 30 22 15
代码混合情感分析数据集CodeMixedSentimentAnalysisDataset-aswin037 数据来源:互联网公开数据 标签:情感分析,代码混合,自然语言处理,社交媒体,数据集,机器学习,文本分析,跨语言研究 数据概述: 该数据集包含来自社交媒体平台的代码混合文本数据,记录了不同语言和代码混合的文本及其对应的情感标签。主要特征如下:...
-
代码混合数据集CodeMixData-shankhad
2025年4月22日 30 83 29
代码混合数据集CodeMixData-shankhad 数据来源:互联网公开数据 标签:代码,编程,数据集,自然语言处理,机器学习,代码生成,多语言,软件工程 数据概述: 该数据集包含来自多种编程语言的代码片段和相关文本描述,旨在支持代码生成,代码理解和代码翻译等任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要基于公开的代码库和文档。...
-
孟加拉语-英语-印地语混合语言侮辱性语言识别数据集
2025年4月15日 30 171 15
孟加拉语-英语-印地语混合语言侮辱性语言识别数据集 数据来源:互联网公开数据 标签:侮辱性语言,代码混合,孟加拉语,英语,印地语,自然语言处理,文本分类,情感分析 数据概述:...
-
PHINC-平行印地英混合语社交媒体语料库用于机器翻译
2025年4月14日 30 154 36
PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
-
达拉兹电商平台多语言产品评论数据集2023
2025年4月14日 30 63 4
达拉兹电商平台多语言产品评论数据集2023 数据来源:互联网公开数据 标签:电商平台,产品评论,多语言处理,情感分析,代码混合,消费者反馈 数据概述:...



