-
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 矛盾检测, 多语言, 文本分类, 机器翻译, 语言学, 阿拉伯语 数据概述:... -
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 孟加拉语, 自然语言处理, 文本分析, 语言学, 文本预处理, 机器翻译, 词干提取 数据概述: 该数据集包含孟加拉语文本的词形还原数据,旨在为孟加拉语文本处理任务提供支持。主要特征如下:... -
数学应用题求解数据集MathWordProblemSolvingDataset-ppt1524
数学应用题求解数据集MathWordProblemSolvingDataset-ppt1524 数据来源:互联网公开数据 标签:数学应用题, 自然语言处理, 数学教育, 文本分析, 数据增强, 机器翻译, 深度学习, 数学建模 数据概述: 该数据集包含来自多个数学应用题库的数据,记录了不同类型的数学应用题及其对应的求解过程。主要特征如下:... -
越南语文本分类训练数据集VietnameseTextClassificationTrainingData-nguyenvt1993
越南语文本分类训练数据集VietnameseTextClassificationTrainingData-nguyenvt1993 数据来源:互联网公开数据 标签:文本分类, 自然语言处理, 越南语, 情感分析, 机器翻译, 语料库, 深度学习, 数据标注 数据概述:... -
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien 数据来源:互联网公开数据 标签:机器翻译, 口语, 语言学, 文本翻译, 摩洛哥, 法语, 对比分析, 语料库 数据概述:... -
文本蕴含关系预测提交结果数据集TextualEntailmentPredictionSubmissionResults-alimohmmed
文本蕴含关系预测提交结果数据集TextualEntailmentPredictionSubmissionResults-alimohmmed 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 语义推理, 模型预测, 结果提交, 数据分析, 机器翻译, 情感分析 数据概述:... -
英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis
英语-乌尔都语翻译数据集English-UrduTranslationDataset-cygnusanubis 数据来源:互联网公开数据 标签:机器翻译, 语言模型, 文本翻译, 英语, 乌尔都语, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语和乌尔都语的翻译对,记录了英语句子及其对应的乌尔都语翻译。主要特征如下:... -
新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14
新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 文本生成, 机器翻译, 文本摘要, 验证数据集, 深度学习, 语料库 数据概述:... -
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-praskr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自互联网的印地语-英语双语文本,记录了印地语句子及其对应的英语翻译。主要特征如下:... -
印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr
印地语-英语翻译文本数据集Hindi-EnglishTranslationDataset-sasikr 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 印地语, 英语, 语言学, 自然语言处理, 双语语料库, 文本对齐 数据概述: 该数据集包含来自公开来源的印地语-英语双语文本,记录了印地语文本及其对应的英语翻译。主要特征如下:... -
-
AES-2回译多语种数据集
AES-2回译多语种数据集 数据来源:互联网公开数据 标签:回译,多语种,数据增强,自然语言处理,机器翻译,AES-2竞赛,跨语言分析 数据概述:... -
语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500
语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,人工智能,机器翻译,对话系统 数据概述: 该数据集包含来自Alpaca和FLAN语言模型的生成文本数据,记录了语言模型在多种任务中的文本生成结果。主要特征如下:... -
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:... -
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal
英阿翻译数据集TranslationEnglishArabicDataset-yumnagamal 数据来源:互联网公开数据 标签:机器翻译,英阿翻译,数据集,自然语言处理,文本分析,语言学,深度学习,NLP 数据概述: 该数据集包含英阿双语的翻译文本数据,记录了英语到阿拉伯语的翻译内容。主要特征如下: 时间跨度:... -
机器翻译模型数据集TranslationModelDataset-osamaabobakr
机器翻译模型数据集TranslationModelDataset-osamaabobakr 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言模型,深度学习,人工智能,文本分析,多语言翻译 数据概述: 该数据集包含来自多个来源的多语言文本数据,用于训练和评估机器翻译模型。主要特征如下:... -
自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613
自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器翻译,情感分析,文本分类,深度学习,语言模型 数据概述:该数据集包含用于自然语言处理任务的文本数据,涵盖了多种语言和任务类型。主要特征如下:... -
罗马数字到印地语转换数据集-dushyantsingh1
罗马数字到印地语转换数据集-dushyantsingh1 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,印地语,罗马数字,文本转换,语言模型,印度文化 数据概述: 该数据集包含了罗马数字和对应的印地语数字的转换对,旨在促进罗马数字到印地语数字的自动转换。主要特征如下: 时间跨度:数据涵盖了现代罗马数字和印地语数字的表示。... -
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:... -
自然语言处理BeamSearch结果数据集-r00man
自然语言处理BeamSearch结果数据集-r00man 数据来源:互联网公开数据 标签:自然语言处理,Beam Search,数据集,文本生成,机器翻译,序列标注,深度学习,模型评估 数据概述: 该数据集包含了使用Beam Search算法生成的自然语言处理任务结果。主要特征如下: 时间跨度:数据生成时间为特定任务训练和推理的时间。...