-
孟加拉语-英语平行语料翻译数据集Bengali-EnglishParallelCorpusTranslationDataset-adityavirajrao
孟加拉语-英语平行语料翻译数据集Bengali-EnglishParallelCorpusTranslationDataset-adityavirajrao 数据来源:互联网公开数据 标签:机器翻译, 平行语料库, 孟加拉语, 英语, 文本翻译, 自然语言处理, 语言学, 数据集 数据概述: 该数据集包含来自开放语料库的孟加拉语-... -
预训练Transformer模型应用数据集-uom190544e
预训练Transformer模型应用数据集-uom190544e 数据来源:互联网公开数据 标签:自然语言处理,Transformer,预训练模型,数据集,文本分析,机器翻译,文本生成,深度学习 数据概述:... -
FlauSino-LLM-T5模型训练数据集-brunoflausino
FlauSino-LLM-T5模型训练数据集-brunoflausino 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器翻译,文本摘要,多任务学习,深度学习,模型训练,语言模型 数据概述: 该数据集用于训练 FlauSino-LLM-T5 模型,该模型是基于 T5... -
图像描述生成训练数据集ImageDescriptionGenerationTrainingDataset-uwelcomem
图像描述生成训练数据集ImageDescriptionGenerationTrainingDataset-uwelcomem 数据来源:互联网公开数据 标签:图像描述, 文本生成, 深度学习, 自然语言处理, 机器翻译, 数据集, 图像标注, 模型训练 数据概述: 该数据集包含用于图像描述生成任务的训练数据,记录了图像对应的简短描述。主要特征如下:... -
印地语-英语翻译词汇对照数据集English-MarathiTranslationVocabularyDataset-pushkarmorankar02
印地语-英语翻译词汇对照数据集English-MarathiTranslationVocabularyDataset-pushkarmorankar02 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 词汇对照, 文本数据, 印地语, 英语, 语言学, 数据集 数据概述: 该数据集包含来自互联网的英语-... -
新闻摘要生成数据集NewsSummarizationDataset-ghani86
新闻摘要生成数据集NewsSummarizationDataset-ghani86 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻文章, 深度学习, 机器翻译, 文本生成, 语料库, 摘要模型 数据概述: 该数据集包含来自多个新闻来源的文章及其对应的摘要,旨在用于训练和评估新闻摘要生成模型。主要特征如下:... -
新闻摘要生成数据集Mediasum-49999Dataset-gautamil
新闻摘要生成数据集Mediasum-49999Dataset-gautamil 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,新闻报道,深度学习,文本生成,语言模型 数据概述: 该数据集包含来自多个新闻来源的文章及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度:数据记录的时间范围涵盖了多个时间段的新闻报道。... -
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600
印地语与英语文本摘要数据集HindiandEnglishTextSummarizationDataset-prajwal600 数据来源:互联网公开数据 标签:文本摘要, 机器翻译, 印地语, 英语, 自然语言处理, 跨语言, 摘要生成, 文本分析 数据概述:... -
法律文本摘要生成效果评估数据集LegalTextSummarizationEvaluationDataset-veerchheda69
法律文本摘要生成效果评估数据集LegalTextSummarizationEvaluationDataset-veerchheda69 数据来源:互联网公开数据 标签:文本摘要, 法律文本, 评估, 自然语言处理, 机器翻译, Rouge, 摘要质量, 文本分析 数据概述:... -
中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11
中英翻译短句数据集English-ChineseTranslationShortSentencesDataset-haowu11 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学习, 双语对照, 自然语言处理, 语料库, 语言模型, 文本分析 数据概述: 该数据集包含中英双语短句,记录了英语短语及其对应的中文翻译。主要特征如下:... -
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25
文本语料库嵌入向量数据集TextCorpusEmbeddingVectors-mohanadahmed25 数据来源:互联网公开数据 标签:文本嵌入, 语义分析, 自然语言处理, 深度学习, 向量空间, 语料库, 数据预处理, 机器翻译 数据概述: 该数据集包含经过处理的文本语料库数据及其对应的嵌入向量表示。主要特征如下:... -
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni
土耳其语文本冒犯性内容检测数据集TurkishTextOffensiveContentDetection-glzadeevni 数据来源:互联网公开数据 标签:文本分类, 情感分析, 冒犯性语言, 仇恨言论, 语言学, 自然语言处理, 机器翻译, 语料库 数据概述:... -
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-jannatuladanmahi 数据来源:互联网公开数据 标签:孟加拉语, 文本转换, 语言模型, 机器翻译, 自然语言处理, 数据集, 文本分析, 句子生成 数据概述:... -
Transformer初始模型子集数据集-tatsumicrub
Transformer初始模型子集数据集-tatsumicrub 数据来源:互联网公开数据 标签:Transformer,自然语言处理,数据集,模型训练,文本生成,机器翻译,语言模型,深度学习 数据概述: 该数据集包含用于Transformer初始模型训练和评估的文本数据子集。主要特征如下:... -
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy 数据来源:互联网公开数据 标签:机器翻译, 语言学, 越南语, 高棉语, 语料库, 平行语料, 文本翻译, 自然语言处理 数据概述: 该数据集包含越南语和高棉语的平行文本,旨在为机器翻译、跨语言研究等任务提供支持。主要特征如下:... -
多语言数据集Multy-LangDatasets-embarkiomar
多语言数据集Multy-LangDatasets-embarkiomar 数据来源:互联网公开数据 标签:多语言,数据集,自然语言处理,机器翻译,文本分类,语言模型,人工智能,计算机科学 数据概述: 该数据集包含来自多个语言的数据,记录了不同语言之间的文本对齐和文本分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi
英语到希伯来语翻译数据集OPUSEnglishtoHebrewCSVDataset-williamalabi 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,英语,希伯来语,自然语言处理,文本分析,翻译技术 数据概述: 该数据集包含来自OPUS项目的英语到希伯来语的平行文本数据,记录了大量的英文原文及其对应的希伯来文翻译。主要特征如下:... -
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-hasanalay
科技新闻文本分类数据集TechnologyNewsTextClassificationDataset-hasanalay 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 科技新闻, 自然语言处理, 机器学习, 文本分析, 语料库, 机器翻译 数据概述: 该数据集包含来自土耳其语科技新闻网站的文章数据,记录了科技领域的新闻文章内容。主要特征如下:... -
柬埔寨政治新闻摘要数据集CambodianPoliticalNewsSummaryDataset-sandeep16064
柬埔寨政治新闻摘要数据集CambodianPoliticalNewsSummaryDataset-sandeep16064 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 政治新闻, 柬埔寨, 自然语言处理, 文本分析, 语料库, 机器翻译 数据概述: 该数据集包含来自互联网的柬埔寨政治新闻文章及其对应的摘要。主要特征如下:... -
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid
孟加拉语指令问答数据集BengaliInstructionAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 问答系统, 孟加拉语, 对比学习, 文本生成, 语言模型, 数据集 数据概述: 该数据集包含用于训练和评估孟加拉语指令问答模型的结构化数据。主要特征如下:...