-
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751
越南语-西班牙语平行语料数据集Vietnamese-SpanishParallelCorpus-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 平行语料, 越南语, 西班牙语, 语言学, 自然语言处理, 语料库, 文本对齐 数据概述: 该数据集包含越南语和西班牙语的平行文本对,记录了两种语言的对应翻译示例。主要特征如下:... -
孟加拉语语音识别训练元数据数据集-imtiazprio
孟加拉语语音识别训练元数据数据集-imtiazprio 数据来源:互联网公开数据 标签:语音识别,数据集,孟加拉语,语音数据,自然语言处理,声学模型,机器学习,语言学 数据概述: 该数据集包含孟加拉语语音识别训练的元数据信息,记录了用于训练语音识别模型的相关数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,但通常涵盖了语音识别研究的最新进展。... -
机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid
机器翻译Transformer模型数据集TransformerMTDataset-doltinukuid 数据来源:互联网公开数据 标签:机器翻译,Transformer,数据集,自然语言处理,深度学习,语言学,人工智能,文本分析... -
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:... -
多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules
多语言文本翻译对比数据集MultilingualTextTranslationComparison-shahules 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 文本分析, 语言学, 文本比对, 英语, 西班牙语 数据概述:... -
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall
印度理工学院孟买英印翻译数据集IITBEnglish-HindiTranslationDataset-shirshmall 数据来源:互联网公开数据 标签:机器翻译,英印翻译,自然语言处理,数据集,语言学,文本数据,人工智能,NLP 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpusTranslation-dhruvsinghsachan 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 文本分析 数据概述: 该数据集包含来自互联网的印地语-... -
日语词典数据集JPNDictDataset-abhi5ingh
日语词典数据集JPNDictDataset-abhi5ingh 数据来源:互联网公开数据 标签:语言学,词典,数据集,日语学习,自然语言处理,教育,翻译,语言研究 数据概述: 该数据集包含来自日语词典的数据,记录了日语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,但内容涵盖现代日语常用词汇。... -
阿里与飒达词汇数据集-farismuq2
阿里与飒达词汇数据集-farismuq2 数据来源:互联网公开数据 标签:词汇分析,数据集,情感分析,自然语言处理,文本挖掘,中文文本,语料库,语言学 数据概述: 该数据集包含了阿里和飒达相关的词汇,旨在用于词汇分析、情感分析等自然语言处理任务。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了从早期到现代的词汇。 地理范围:... -
乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek
乌兹别克语问答数据集Question-AnswerUzbekDataset-arslonbek 数据来源:互联网公开数据 标签:乌兹别克语,问答,自然语言处理,数据集,文本分析,机器翻译,语言学,人工智能 数据概述: 该数据集包含乌兹别克语的问答对,旨在促进乌兹别克语的自然语言处理研究和应用。主要特征如下: 时间跨度:数据收集时间不限,持续更新。... -
乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev
乌兹别克语音识别数据集VoiceRecognitionUzbekDataset-bexruznutfilloyev 数据来源:互联网公开数据 标签:语音识别,乌兹别克语,数据集,自然语言处理,机器学习,语音处理,音频分析,语言学 数据概述: 该数据集包含乌兹别克语的语音数据,旨在用于语音识别系统的训练和评估。主要特征如下: 时间跨度:... -
马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad
马拉提语文档数据集MarathiDocumentsDataset-ashwanillkagechaad 数据来源:互联网公开数据 标签:马拉提语,文档数据集,自然语言处理,机器学习,文本分析,印度文化,学术资源,语言学 数据概述: 该数据集包含来自多个来源的马拉提语文档,记录了马拉提语的文本数据,适用于自然语言处理、文本分析等任务。主要特征如下:... -
文本预处理语料库TextPreprocessingCorpus-dinhnhattruong
文本预处理语料库TextPreprocessingCorpus-dinhnhattruong 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本挖掘,数据清洗,语言学,信息检索 数据概述:该数据集包含了来自互联网和公开出版物的文本数据,适用于文本预处理、自然语言处理等任务。主要特征如下:... -
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo
多语言翻译平行语料数据集MultilingualTranslationParallelCorpus-juanjosmorenogiraldo 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 语言学, 翻译模型, 文本数据, 英语, 德语, 西班牙语 数据概述:... -
泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha
泰英双语翻译文本数据集Thai-EnglishBilingualTranslationText-jaroensakyodkantha 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 双语语料库, 泰语, 英语, 自然语言处理, 语言学, 数据清洗 数据概述:... -
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53
多语言维基百科内容翻译对照数据集MultilingualWikipediaContentTranslationDataset-bamps53 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 维基百科, 自然语言处理, 文本对齐, 语料库, 语言学 数据概述:... -
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431
印度多语种文本转录数据集IndianMulti-languageTextTransliterationDataset-jaswanth431 数据来源:互联网公开数据 标签:文本转录, 多语言, 印度语言, 机器翻译, 自然语言处理, 语料库, 语言学, 深度学习 数据概述:... -
BUET神经机器翻译数据集BUET神经机器翻译数据集-jakir57
BUET神经机器翻译数据集BUET神经机器翻译数据集-jakir57 数据来源:互联网公开数据 标签:神经机器翻译,数据集,自然语言处理,机器学习,语言学,多语言,翻译技术,数据驱动 数据概述: 该数据集由布里斯托大学工程技术学院提供,专注于神经机器翻译任务,包含多种语言的平行语料库。主要特征如下:... -
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad
诺阿卡利语语音识别数据集NoakhaliSpeechRecognitionDataset-kaggletrailjawad 数据来源:互联网公开数据 标签:语音识别, 诺阿卡利语, 语音数据集, 声学模型, 语言学, 文本转录, 语音转文本, 深度学习 数据概述:... -
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:...