-
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05 数据来源:互联网公开数据 标签:语义相似度, 文本理解, 自然语言处理, 句子对, 情感分析, 机器翻译, 文本匹配, 数据集 数据概述: 该数据集包含来自多个来源的文本对,记录了句子之间的语义相似度信息。主要特征如下:... -
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-xbxbxb123
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-xbxbxb123 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文NLP, 情感识别, 机器翻译, 数据集, 深度学习, 自然语言处理 数据概述:... -
基尼亚语文本相似度训练数据集KinyarwandaTextSimilarityTrainingData-rookiejing
基尼亚语文本相似度训练数据集KinyarwandaTextSimilarityTrainingData-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 基尼亚语, 自然语言处理, 语料库, 机器翻译, 文本匹配, 情感分析, 数据标注 数据概述: 该数据集包含来自基尼亚语文本的配对数据,记录了文本对之间的相似度评分。主要特征如下:... -
波斯古典文学诗歌Prompt-Completion数据集PersianClassicalPoetryPrompt-CompletionDataset-minar61
波斯古典文学诗歌Prompt-Completion数据集PersianClassicalPoetryPrompt-CompletionDataset-minar61 数据来源:互联网公开数据 标签:波斯语, 诗歌, 文本生成, 自然语言处理, Prompt, Completion, 机器翻译, 语言模型 数据概述:... -
维基百科中文文本摘要数据集WikipediaChineseTextSummaryDataset-omerparlak
维基百科中文文本摘要数据集WikipediaChineseTextSummaryDataset-omerparlak 数据来源:互联网公开数据 标签:文本摘要, 中文文本, 维基百科, 自然语言处理, 文本挖掘, 语料库, 机器翻译, 深度学习 数据概述: 该数据集包含来自维基百科的中文文本摘要,旨在为文本摘要任务提供训练和评估数据。主要特征如下:... -
心理健康多语言问答数据集MentalHealthMultilingualQuestionandAnswerDataset-mohamedbassat
心理健康多语言问答数据集MentalHealthMultilingualQuestionandAnswerDataset-mohamedbassat 数据来源:互联网公开数据 标签:心理健康, 问答系统, 情感分析, 机器翻译, 文本生成, 多语言, 阿拉伯语, 英语 数据概述:... -
文本语言识别数据集TextLanguageIdentificationDataset-abdullahkhan098
文本语言识别数据集TextLanguageIdentificationDataset-abdullahkhan098 数据来源:互联网公开数据 标签:文本分析, 语言识别, 自然语言处理, 多语言, 文本分类, 数据标注, 机器翻译, 语料库 数据概述:... -
机器翻译英语-法语平行语料数据集MachineTranslationEnglish-FrenchParallelCorpus-giangtranduc
机器翻译英语-法语平行语料数据集MachineTranslationEnglish-FrenchParallelCorpus-giangtranduc 数据来源:互联网公开数据 标签:机器翻译, 语料库, 英语, 法语, 自然语言处理, 文本数据, 语言模型, 翻译模型 数据概述:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-phoenixdev
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-phoenixdev 数据来源:互联网公开数据 标签:乌尔都语,文本摘要,自然语言处理,新闻摘要,语言模型,文本分析,机器翻译,语料库 数据概述: 该数据集包含来自互联网的乌尔都语新闻摘要,记录了新闻文章的摘要内容。主要特征如下:... -
多语言翻译文本数据集MultilingualTranslationTextDataset-duy52000751
多语言翻译文本数据集MultilingualTranslationTextDataset-duy52000751 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 语言模型, 文本数据, 越南语, 西班牙语, 英语, 数据集 数据概述:... -
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 语言模型, 困惑度, ChrF评分, 翻译质量, 跨语言, 文本对齐 数据概述:... -
机器学习入门视频摘要与文本数据集MachineLearningIntroductoryVideoSummariesandTranscripts-aneka...
机器学习入门视频摘要与文本数据集MachineLearningIntroductoryVideoSummariesandTranscripts-anekantsinghai 数据来源:互联网公开数据 标签:机器学习, 视频摘要, 文本分析, 自然语言处理, 课程资源, 教学视频, 文本摘要, 机器翻译 数据概述:... -
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 语料库, 文本对齐, 自然语言处理, 语言学, 数据集 数据概述: 该数据集包含俄语与英语的平行文本,记录了俄语原文及其对应的英语译文。主要特征如下:... -
印尼多语言平行语料库-爪哇语-巽他语和马来语文本数据集IndonesianMultilingualParallelCorpus-Javanese-Sund...
印尼多语言平行语料库-爪哇语-巽他语和马来语文本数据集IndonesianMultilingualParallelCorpus-Javanese-Sundanese-andMalayTextDataset-alfaariizii 数据来源:互联网公开数据 标签:平行语料库, 机器翻译, 语言学, 爪哇语, 巽他语, 马来语, 文本数据, 自然语言处理... -
越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai
越南语-英语语义相似度分析数据集Vietnamese-EnglishSemanticSimilarityAnalysisDataset-dangthai 数据来源:互联网公开数据 标签:语义相似度, 越南语, 英语, 文本匹配, 自然语言处理, 机器翻译, 双语语料, 文本对 数据概述: 该数据集包含越南语-... -
印地语-英语翻译指令数据集Hindi-EnglishTranslationInstructionDataset-jaydee29
印地语-英语翻译指令数据集Hindi-EnglishTranslationInstructionDataset-jaydee29 数据来源:互联网公开数据 标签:机器翻译, 语言翻译, 印地语, 英语, 自然语言处理, 文本翻译, 数据标注, 多语言 数据概述: 该数据集包含来自公开渠道的印地语-... -
日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa
日语-英语机器翻译平行语料数据集Japanese-EnglishMachineTranslationParallelCorpus-arvindvasa 数据来源:互联网公开数据 标签:机器翻译, 语料库, 日语, 英语, 文本数据, 自然语言处理, 语言学习, 翻译模型 数据概述:... -
英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1
英语-泰卢固语翻译数据集English-TeluguTranslationDataset-peaking1 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 文本翻译, 泰卢固语, 英语, 翻译模型, 自然语言处理, 语料库 数据概述: 该数据集包含英语到泰卢固语的翻译文本对,记录了英语短语或句子及其对应的泰卢固语翻译。主要特征如下:... -
多语言文本蕴含关系判断数据集MultilingualTextualEntailmentRelationshipJudgment-tuckerarrants
多语言文本蕴含关系判断数据集MultilingualTextualEntailmentRelationshipJudgment-tuckerarrants 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 多语言, 语义推理, 文本匹配, 情感分析, 机器翻译, 语料库 数据概述:... -
普什图语情感分析语料数据集PashtoSentimentAnalysisCorpus-drijaz
普什图语情感分析语料数据集PashtoSentimentAnalysisCorpus-drijaz 数据来源:互联网公开数据 标签:情感分析, 普什图语, 文本分类, 机器翻译, 自然语言处理, 语料库, 阿富汗, 情感极性 数据概述: 该数据集包含普什图语文本及其对应的情感标签和英文翻译。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态语料。...