-
多语言文本语义相似度评测数据集MultilingualTextSemanticSimilarityEvaluationDataset-shubhamkathiriya
多语言文本语义相似度评测数据集MultilingualTextSemanticSimilarityEvaluationDataset-shubhamkathiriya 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 多语言, 文本匹配, 语义分析, 自然语言处理, 语言对比, 数据集 数据概述:... -
孟加拉语新闻摘要文本分类数据集BengaliNewsSummaryTextClassificationDataset-nirob5315
孟加拉语新闻摘要文本分类数据集BengaliNewsSummaryTextClassificationDataset-nirob5315 数据来源:互联网公开数据 标签:文本摘要, 文本分类, 孟加拉语, 自然语言处理, 情感分析, 多分类, 机器翻译, 语料库 数据概述:... -
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi
突尼斯阿拉伯语-英语翻译对照数据集TunisianArabic-EnglishTranslationDataset-khawlajlassi 数据来源:互联网公开数据 标签:机器翻译, 语言学, 阿拉伯语, 英语, 文本翻译, 语料库, 自然语言处理, 双语对照 数据概述:... -
越南语文本相似度评估数据集VietnameseTextSimilarityEvaluationDataset-dangthai
越南语文本相似度评估数据集VietnameseTextSimilarityEvaluationDataset-dangthai 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 越南语, 语义分析, 文本匹配, 机器翻译, 语言模型, 数据集 数据概述: 该数据集包含越南语文本对,用于评估句子间的语义相似度。主要特征如下:... -
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua 数据来源:互联网公开数据 标签:机器翻译, 俄语, 文本翻译, 自然语言处理, 文本对齐, 语言模型, 翻译评估, 文本处理 数据概述:... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentRelations-ravi02516
多语言文本蕴含关系数据集MultilingualTextualEntailmentRelations-ravi02516 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 多语言, 机器翻译, 语义理解, 文本推理, 语料分析, 文本匹配 数据概述: 该数据集包含来自互联网的翻译文本数据,记录了不同语言的文本对之间的蕴含关系。主要特征如下:... -
文本相似度评估微软释义数据集TextSimilarityEvaluationMicrosoftParaphraseDataset-srinu513
文本相似度评估微软释义数据集TextSimilarityEvaluationMicrosoftParaphraseDataset-srinu513 数据来源:互联网公开数据 标签:文本相似度, 自然语言处理, 释义识别, 语义分析, 机器翻译, 文本匹配, 数据集, 微软 数据概述:... -
俄语文本摘要评估指标数据集RussianTextSummarizationEvaluationMetrics-leinee
俄语文本摘要评估指标数据集RussianTextSummarizationEvaluationMetrics-leinee 数据来源:互联网公开数据 标签:文本摘要, 俄语, 评估指标, 自动摘要, 自然语言处理, 机器翻译, ROUGE, 余弦相似度 数据概述:... -
多语言情感分析验证数据集MultilingualSentimentAnalysisValidationDataset-rookiejing
多语言情感分析验证数据集MultilingualSentimentAnalysisValidationDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 多语言, 文本分类, 情绪识别, 机器翻译, 自然语言处理, 情感标注, 验证集 数据概述:... -
多语言句子翻译与对比数据集MultilingualSentenceTranslationandComparisonDataset-phrasy
多语言句子翻译与对比数据集MultilingualSentenceTranslationandComparisonDataset-phrasy 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 多语言, 自然语言处理, 英语, 法语, 语料库, 句子对齐 数据概述:... -
文本摘要与情感分析数据集TextSummarizationandSentimentAnalysisDataset-juliojuse
文本摘要与情感分析数据集TextSummarizationandSentimentAnalysisDataset-juliojuse 数据来源:互联网公开数据 标签:文本摘要, 情感分析, 机器翻译, 语料库, 自然语言处理, 文本分类, 数据集, 机器学习 数据概述:... -
文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha
文本语义改写对比数据集TextSemanticParaphraseComparison-lehoangminhha 数据来源:互联网公开数据 标签:文本改写, 语义相似度, 自然语言处理, 文本匹配, 数据标注, 机器翻译, 语言模型, 文本生成 数据概述:... -
文本生成与事实性评估数据集TextGenerationandFactualityAssessmentDataset-vsevolodbogodist
文本生成与事实性评估数据集TextGenerationandFactualityAssessmentDataset-vsevolodbogodist 数据来源:互联网公开数据 标签:文本生成, 事实性评估, 问答系统, 摘要生成, 机器翻译, 自然语言处理, 数据标注, 幻觉检测 数据概述:... -
中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123
中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 中文, 英文, 翻译模型, 双语语料库, 自然语言处理 数据概述: 该数据集包含中英双语的短语句对,记录了英文短语及其对应的中文翻译。主要特征如下:... -
多语言文本语义相似度评估数据集MultilingualTextSemanticSimilarityAssessment-rookiemuzi
多语言文本语义相似度评估数据集MultilingualTextSemanticSimilarityAssessment-rookiemuzi 数据来源:互联网公开数据 标签:文本相似度, 多语言, 语义分析, 对比分析, 机器翻译, 阿拉伯语, 西班牙语, 英语, 亚美尼亚语 数据概述:... -
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentRelationInferenceDataset-arnab9961
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentRelationInferenceDataset-arnab9961 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 文本匹配, 语篇分析, 机器翻译, 深度学习, 语言学 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-akashhalayyanavar
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-akashhalayyanavar 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本对齐, 语言学, 自然语言处理, 双语数据 数据概述: 该数据集包含印地语和英语的双语平行语料,用于机器翻译模型的训练和评估。主要特征如下:... -
孟加拉语数学应用题数据集BengaliMathWordProblemDataset-aranyasaha
孟加拉语数学应用题数据集BengaliMathWordProblemDataset-aranyasaha 数据来源:互联网公开数据 标签:数学教育, 孟加拉语, 文本分析, 自然语言处理, 词题理解, 语言模型, 数据标注, 机器翻译 数据概述: 该数据集包含孟加拉语编写的数学应用题,旨在为自然语言处理和教育研究提供支持。主要特征如下:... -
僧伽罗语-英语翻译数据集Sinhala-EnglishTranslationDataset-uom23mlmsc239337p
僧伽罗语-英语翻译数据集Sinhala-EnglishTranslationDataset-uom23mlmsc239337p 数据来源:互联网公开数据 标签:机器翻译, 语言翻译, 僧伽罗语, 英语, 文本数据, 语料库, 自然语言处理, 翻译模型 数据概述: 该数据集包含来自多种来源的僧伽罗语-... -
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 文本分析, 语言学, 词汇, 语料库, 机器翻译 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,用于训练和评估孟加拉语词形还原模型。主要特征如下:...