-
软件使用说明数据集SoftwareInstructionsDataset-omarayman67
软件使用说明数据集SoftwareInstructionsDataset-omarayman67 数据来源:互联网公开数据 标签:软件使用说明,数据集,用户手册,技术支持,自然语言处理,机器翻译,信息检索,用户体验 数据概述: 该数据集包含了多种软件的使用说明和用户手册,适用于自然语言处理,机器翻译,信息检索等任务。主要特征如下:... -
亚马逊评论字幕数据集ARC-SubsDataset-philipkd
亚马逊评论字幕数据集ARC-SubsDataset-philipkd 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,字幕,情感分析,机器翻译,评论,亚马逊 数据概述: 该数据集包含了来自亚马逊网站的商品评论以及对应的字幕数据,旨在为自然语言处理任务提供训练和评估资源。主要特征如下:... -
印地语-英语混合语言数据集-saahir2629
印地语-英语混合语言数据集-saahir2629 数据来源:互联网公开数据 标签:印地语,英语,混合语言,数据集,自然语言处理,文本分析,机器翻译,语言学 数据概述:该数据集包含印地语和英语混合语言的文本数据,记录了两种语言混合使用的各种场景。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了现代社交媒体和日常交流中的常见用例。... -
文档摘要对数据集Document-AbstractPairsDataset-sark07
文档摘要对数据集Document-AbstractPairsDataset-sark07 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,深度学习,文本生成,机器翻译,信息检索,NLP 数据概述: 该数据集包含文档及其对应的摘要,旨在用于文本摘要生成任务。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始文档的发布时间。... -
英语到希伯来语圣经翻译数据集English-to-HebrewBibleTranslationsDataset-williamalabi
英语到希伯来语圣经翻译数据集English-to-HebrewBibleTranslationsDataset-williamalabi 数据来源:互联网公开数据 标签:圣经翻译,语言学,数据集,机器翻译,文本分析,宗教研究,自然语言处理,多语言 数据概述: 该数据集包含英语到希伯来语的圣经翻译文本,记录了圣经经文的双语对照内容。主要特征如下:... -
平行约鲁巴语与英语翻译提示数据集ParallelYoruba-EnglishPromptsforTranslationDataset-danishbaloch010
平行约鲁巴语与英语翻译提示数据集ParallelYoruba-EnglishPromptsforTranslationDataset-danishbaloch010 数据来源:互联网公开数据 标签:约鲁巴语,英语,翻译,平行语料库,自然语言处理,机器翻译,语言学,数据集... -
三星自然语言处理数据集SamsungNLPDataset-garvitgarg
三星自然语言处理数据集SamsungNLPDataset-garvitgarg 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,情感分析,机器翻译 数据概述: 该数据集由三星公司提供,专注于自然语言处理领域的文本数据,记录了多种自然语言处理任务的训练和测试数据。主要特征如下:... -
俄罗斯越南语言数据集RussianVietnameseDataset-flightstar
俄罗斯越南语言数据集RussianVietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,机器翻译,跨语言分析,人工智能,语言研究,文本分析 数据概述: 该数据集包含来自互联网公开资源的俄语和越南语语言数据,记录了两种语言的文本句子对,适用于机器翻译,语言学研究等任务。主要特征如下:... -
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth 数据来源:互联网公开数据 标签:语言翻译,语料库,自然语言处理,多语言,机器翻译,文本分析,语言资源,人工智能 数据概述: 该数据集包含来自英语到豪萨语的平行语料,记录了双语文本对,适用于机器翻译和语言学研究。主要特征如下:... -
英语到泰卢固语翻译数据集English-to-TeluguTranslationDataset-pavanreddy6
英语到泰卢固语翻译数据集English-to-TeluguTranslationDataset-pavanreddy6 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言学习,泰卢固语,英语,文本翻译,人工智能 数据概述:... -
孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif
孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,机器翻译,数据集,深度学习,语言模型,机器学习,人工智能 数据概述: 该数据集专注于孟加拉语文本的摘要生成任务,记录了大量的孟加拉语文本及其对应的摘要。主要特征如下:... -
英文-印地语文本语料库
英文-印地语文本语料库 数据来源:互联网公开数据 标签:英文,印地语,文本语料库,机器翻译,语言处理,平行语料,数据清洗 数据概述: 本数据集包含来自两个公开来源的英文-印地语文本数据。其中,英文-印地语数据集基于印度理工学院孟买分校(IIT... -
英语到泰卢固语高质量翻译数据集EnglishtoTeluguHigh-QualityTranslationDataset-krizzna69
英语到泰卢固语高质量翻译数据集EnglishtoTeluguHigh-QualityTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,翻译质量,英语,泰卢固语,自然语言处理,多语言 数据概述:... -
土耳其新闻文本分类数据集TurkishNewsDatasetforCNN-denizhanahin
土耳其新闻文本分类数据集TurkishNewsDatasetforCNN-denizhanahin 数据来源:互联网公开数据 标签:新闻文本,文本分类,自然语言处理,深度学习,卷积神经网络,土耳其语,数据集,机器翻译 数据概述: 该数据集包含了来自土耳其新闻网站的新闻文章文本数据,用于文本分类任务。主要特征如下:... -
土耳其语文本数据集Linux-denizhanahin
土耳其语文本数据集Linux-denizhanahin 数据来源:互联网公开数据 标签:土耳其语,文本,数据集,自然语言处理,语言模型,文本分析,机器翻译,Linux 数据概述: 该数据集包含来自Linux环境下的土耳其语文本数据,主要记录了各种Linux系统和应用程序的土耳其语文本信息。主要特征如下:... -
英语到印地语词典数据集-piyush512
英语到印地语词典数据集-piyush512 数据来源:互联网公开数据 标签:词典,翻译,印地语,英语,自然语言处理,语言学,数据集,机器翻译 数据概述: 该数据集包含英语到印地语的词汇翻译数据,旨在为语言研究和机器翻译应用提供支持。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但数据内容反映了词汇翻译的通用性。 地理范围:... -
希伯来文化平台科技文化视角多语言平行文本数据集
希伯来文化平台科技文化视角多语言平行文本数据集 数据来源:互联网公开数据 标签:平行文本,多语言,希伯来语,文化,科技,HTML,文本挖掘,机器翻译,语料库 数据概述: 本数据集收录了来自以色列领先的希伯来文化平台Hitdarderut... -
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer
阿拉伯语文本摘要数据集ArabicTextSummarizationDataset-fadyelkbeer 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,阿拉伯语,深度学习,数据集,机器翻译,语言模型,NLP 数据概述: 该数据集包含大量阿拉伯语文本及其对应的摘要,旨在用于阿拉伯语文本摘要任务的研究与开发。主要特征如下:... -
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov
楚瓦什语维基百科平行语料库数据集Chuvash-WikiParallelCorpusDataset-kvzhirnov 数据来源:互联网公开数据 标签:语言资源,平行语料库,自然语言处理,机器翻译,楚瓦什语,维基百科,多语言数据,文本分析 数据概述:... -
UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti
UnivAI黑客松数据集UnivAIHackathonDataset-manasdalakoti 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,情感分析,机器翻译,机器学习,人工智能,文本挖掘 数据概述: 该数据集包含来自UnivAI黑客松活动的数据,记录了参赛者在活动中生成和处理的文本数据。主要特征如下:...