-
孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal
孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,孟加拉语,新闻,数据集,NLP,机器翻译,语言模型 数据概述: 该数据集包含来自孟加拉语新闻网站Prothom Alo的新闻文章及其摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了Prothom... -
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc 数据来源:互联网公开数据 标签:机器翻译,数据集,文本翻译,自然语言处理,英语,多语言,深度学习,NLP 数据概述: 该数据集包含了用于训练和评估多语言翻译模型(MT5)的英语翻译数据,专注于英语与其他语言之间的翻译。主要特征如下:... -
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试... -
蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020
蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本翻译,深度学习,语言模型,翻译研究,计算机科学 数据概述: 该数据集包含来自Spider项目的翻译数据,记录了多种语言之间的文本翻译对。主要特征如下:... -
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:... -
文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees
文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,深度学习,NLP,文本分析,语言模型 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在训练和评估自动文本摘要模型。主要特征如下: 时间跨度:... -
英语到乌尔都语句子翻译数据集-syednabeeluddin
英语到乌尔都语句子翻译数据集-syednabeeluddin 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,英语,乌尔都语,翻译,语言学,深度学习 数据概述: 该数据集包含英语句子及其对应的乌尔都语翻译。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但涵盖了现代英语和乌尔都语的常用表达。... -
乌尔都语罗马转写资源数据集-zeshanali
乌尔都语罗马转写资源数据集-zeshanali 数据来源:互联网公开数据 标签:乌尔都语,罗马转写,语言资源,自然语言处理,数据集,文本分析,机器翻译,文本转换 数据概述: 该数据集包含了乌尔都语的罗马字母转写文本资源。主要特征如下: 时间跨度:数据涵盖了不同时期的乌尔都语文本。 地理范围:数据主要来源于乌尔都语使用者群体。... -
英语-印地语平行语料库数据集English-HindiParallelCorpusDataset-rohitashchakra
英语-印地语平行语料库数据集English-HindiParallelCorpusDataset-rohitashchakra 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,平行语料,印地语,英语,数据集,语言学,人工智能 数据概述: 该数据集包含英语和印地语的平行文本数据,记录了两种语言之间的对应翻译内容。主要特征如下:... -
孟加拉语文本摘要模型数据集BanglaTextSummarizationModelDataset-devtousif
孟加拉语文本摘要模型数据集BanglaTextSummarizationModelDataset-devtousif 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,语言学,机器翻译,人工智能 数据概述: 该数据集包含来自互联网公开资源的孟加拉语文本及其对应的摘要,主要用于文本摘要生成模型的训练和评估。主要特征如下:... -
多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc
多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc 数据来源:互联网公开数据 标签:机器翻译,文本转换,多任务学习,数据集,自然语言处理,深度学习,人工智能,语言模型 数据概述: 该数据集由MT5(Multitask Translation Transformer)项目提供,专注于多任务翻译和文本转换任务。主要特征如下:... -
Transformer模型研究数据集-abhishek
Transformer模型研究数据集-abhishek 数据来源:互联网公开数据 标签:自然语言处理,深度学习,Transformer,文本分析,机器翻译,模型训练,数据集,NLP 数据概述: 该数据集包含与 Transformer 模型相关的各种数据,主要用于模型训练,评估和研究。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了从早期... -
英印双语词汇数据集2023英印双语词汇数据集2023-tihsrahly
英印双语词汇数据集2023英印双语词汇数据集2023-tihsrahly 数据来源:互联网公开数据 标签:英印双语,词汇,数据集,语言学,自然语言处理,机器翻译,教育,多语言学习 数据概述:该数据集包含英印双语词汇数据,记录了英语和印地语词汇的对应关系及相关信息。主要特征如下: 时间跨度:数据记录的时间范围从2023年。... -
英语-德语翻译数据集English-to-GermanTranslationDataset-shashanknecrothapa
英语-德语翻译数据集English-to-GermanTranslationDataset-shashanknecrothapa 数据来源:互联网公开数据 标签:机器翻译,语言学习,数据集,自然语言处理,人工智能,双语对照,文本处理,教育应用 数据概述: 该数据集包含英语到德语的文本翻译对,记录了大量的英语句子及其对应的德语翻译。主要特征如下:... -
英文翻译矛盾数据集EnglishTranslationContradictionDataset-sadiq18
英文翻译矛盾数据集EnglishTranslationContradictionDataset-sadiq18 数据来源:互联网公开数据 标签:翻译,机器翻译,数据集,自然语言处理,文本分析,矛盾检测,语言学,英语 数据概述: 该数据集包含了英语文本及其对应的翻译,旨在研究翻译中的矛盾和不一致性。主要特征如下:... -
社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach
社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach 数据来源:互联网公开数据 标签:图像描述,翻译,社交媒体,数据集,自然语言处理,机器翻译,多语言,计算机视觉 数据概述:该数据集包含来自Flickr平台的图片及其描述,并提供了相应描述的尼泊尔语翻译。主要特征如下:... -
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:... -
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:... -
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance... -
波斯语数据集PersianDataset-amirali10281
波斯语数据集PersianDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,语言学,自然语言处理,数据集,文本分析,机器翻译,文本分类,语音识别 数据概述: 该数据集包含波斯语文本和相关数据,旨在为波斯语语言处理研究提供支持。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和类型的波斯语文本。...