-
多语言平行文本互译数据集MultilingualParallelTextTranslationDataset-shubhamkathiriya
多语言平行文本互译数据集MultilingualParallelTextTranslationDataset-shubhamkathiriya 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 语言模型, 文本校对, 西班牙语, 印地语, 英语 数据概述:... -
南非北部索托语文本对齐数据集NorthernSothoTextAlignmentDataset-girlyphaladi
南非北部索托语文本对齐数据集NorthernSothoTextAlignmentDataset-girlyphaladi 数据来源:互联网公开数据 标签:文本对齐, 机器翻译, 语言学, 南非语, 语料库, 自然语言处理, 文本分析, 语言资源 数据概述: 该数据集包含来自南非北部索托语的文本对齐数据,记录了不同语句在语料库中的对应关系。主要特征如下:... -
产品组装流程多语言文本对照数据集ProductAssemblyProcessMultilingualTextAlignment-patxhaui
产品组装流程多语言文本对照数据集ProductAssemblyProcessMultilingualTextAlignment-patxhaui 数据来源:互联网公开数据 标签:产品组装, 多语言, 文本对照, 机器翻译, 流程规范, 质量控制, 语料库, 文本对齐 数据概述:... -
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush
俄语平行语料机器翻译数据集Russian-EnglishParallelCorpusforMachineTranslation-riapush 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 平行语料, 自然语言处理, 文本对齐, 语言模型, 跨语言 数据概述:... -
多语言问答视频字幕数据集MultilingualQuestionAnsweringVideoSubtitles-dikideep
多语言问答视频字幕数据集MultilingualQuestionAnsweringVideoSubtitles-dikideep 数据来源:互联网公开数据 标签:多语言, 问答, 视频字幕, 机器翻译, 文本匹配, 语义理解, 跨语言检索, 对比分析 数据概述: 该数据集包含来自dikideep-... -
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing
多语言文本相似度评估数据集MultilingualTextSimilarityEvaluationDataset-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语料库, 机器翻译, 自然语言处理, 文本匹配, 语言学, 数据标注 数据概述: 该数据集包含来自不同语言的文本对,记录了文本对之间的相似度评分。主要特征如下:... -
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu
越南语文本数据增强数据集VietnameseTextDataAugmentation-lvhieu 数据来源:互联网公开数据 标签:文本增强, 越南语, 自然语言处理, 数据集构建, 机器翻译, 语言模型, 数据扩充, 文本生成 数据概述: 该数据集包含用于越南语文本数据增强的语料,记录了越南语文本对及其对应的增强版本。主要特征如下:... -
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69
英语-泰卢固语平行语料翻译数据集English-TeluguParallelCorpus-krizzna69 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 文本翻译, 英语, 泰卢固语, 自然语言处理, 平行语料 数据概述: 该数据集包含英语与泰卢固语的平行文本,记录了两种语言之间的翻译对应关系。主要特征如下:... -
多语言对话意图识别数据集MultilingualDialogueIntentRecognitionDataset-saumyamishra536
多语言对话意图识别数据集MultilingualDialogueIntentRecognitionDataset-saumyamishra536 数据来源:互联网公开数据 标签:对话系统, 意图识别, 机器翻译, 自然语言处理, 多语言, 文本分析, 语义理解, 跨语言 数据概述:... -
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91
印度尼西亚语宗教文本翻译数据集IndonesianReligiousTextTranslation-adeliaherlisa91 数据来源:互联网公开数据 标签:印尼语, 宗教文本, 翻译, 文本对齐, 自然语言处理, 机器翻译, 语料库, 文本分析 数据概述: 该数据集包含来自印度尼西亚语的宗教文本,记录了原始文本及其对应的翻译。主要特征如下:... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-tylermeier
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-tylermeier 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 机器翻译, 情感分析, 文本匹配, 语言学, 深度学习 数据概述: 该数据集包含来自tylermeier-... -
孟加拉语文本数据集BengaliTextDataset-nasiatfahim
孟加拉语文本数据集BengaliTextDataset-nasiatfahim 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 语料库, 自然语言处理, 文本分析, 机器翻译, 情感分析, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本内容。主要特征如下:... -
多语言文化隐喻理解数据集MultilingualCulturalMetaphorUnderstandingDataset-danielpasarella
多语言文化隐喻理解数据集MultilingualCulturalMetaphorUnderstandingDataset-danielpasarella 数据来源:互联网公开数据 标签:文化隐喻, 多语言, 自然语言处理, 文本分类, 机器翻译, 情感分析, Kannada, 印度文化 数据概述: 该数据集包含来自不同语言(包括... -
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu
多语言文本改写与翻译数据集MultilingualTextRewritingandTranslationDataset-yinjiashu 数据来源:互联网公开数据 标签:文本改写, 机器翻译, 多语言, 语言模型, 文本生成, 自然语言处理, 文本校对, 语言学习 数据概述:... -
语音识别Whisper模型输出结果数据集SpeechRecognitionWhisperModelOutputResults-yumoan
语音识别Whisper模型输出结果数据集SpeechRecognitionWhisperModelOutputResults-yumoan 数据来源:互联网公开数据 标签:语音识别, Whisper模型, 声学模型, 文本转录, 语音转文本, 机器翻译, 自然语言处理, 深度学习 数据概述:... -
新闻摘要生成与文本摘要数据集NewsSummaryGenerationandTextSummarizationDataset-miklosgergely
新闻摘要生成与文本摘要数据集NewsSummaryGenerationandTextSummarizationDataset-miklosgergely 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, CNN模型, 数据集构建, 文本分析, 新闻报道 数据概述:... -
孟加拉语神经机器翻译训练数据集BanglaNeuralMachineTranslationTrainingData-rakibullah
孟加拉语神经机器翻译训练数据集BanglaNeuralMachineTranslationTrainingData-rakibullah 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 自然语言处理, 文本数据, 训练集, 文本对齐, 神经网络, 语言模型 数据概述:... -
机器翻译质量评估文本数据集MachineTranslationQualityAssessmentTextDataset-valeriiamoiseeva
机器翻译质量评估文本数据集MachineTranslationQualityAssessmentTextDataset-valeriiamoiseeva 数据来源:互联网公开数据 标签:机器翻译, 文本评估, 翻译质量, 文本分析, 语言学, 自然语言处理, 评估指标, 对比分析 数据概述:... -
斯瓦希里语推文翻译数据集SwahiliTweetTranslationDataset-mikemollel
斯瓦希里语推文翻译数据集SwahiliTweetTranslationDataset-mikemollel 数据来源:互联网公开数据 标签:斯瓦希里语, 语言翻译, 文本数据, 机器翻译, 社交媒体, 文本分析, 自然语言处理, 数据集 数据概述:... -
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash
泰米尔语文本翻译数据集TamilLanguageTranslationDataset-rnaveenprakash 数据来源:互联网公开数据 标签:泰米尔语, 机器翻译, 文本翻译, 语言模型, 自然语言处理, 数据集构建, 语言学, 语料库 数据概述: 该数据集包含泰米尔语文本及其对应的翻译,旨在用于训练和评估机器翻译模型。主要特征如下:...