-
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:...
-
多语言新闻文章数据集Multi-NewsDataset-terrychanorg
多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源:互联网公开数据 标签:新闻,多语言,数据集,自然语言处理,文本摘要,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自不同语言的新闻文章,用于文本摘要和多语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于新闻来源的更新频率。...
-
多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431
多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:...
-
新冠疫情社交媒体文本分析数据集COVID-19SocialMediaTextAnalysisDataset-bugraayan1
新冠疫情社交媒体文本分析数据集COVID-19SocialMediaTextAnalysisDataset-bugraayan1 数据来源:互联网公开数据 标签:新冠疫情, 社交媒体, 文本分析, 多语言, 疫情传播, 舆情分析, 情感分析, 机器学习 数据概述:...
-
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 印度语, 英语, Hinglish, 语料库, 语言模型 数据概述:...
-
机器翻译训练与评估数据集NMTTranslationDataset-jeevats
机器翻译训练与评估数据集NMTTranslationDataset-jeevats 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,文本分析,多语言,深度学习,人工智能 数据概述: 该数据集包含用于机器翻译任务的双语平行文本数据,记录了源语言和目标语言之间的翻译对。主要特征如下:...
-
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:文本数据,翻译,评论,自然语言处理,机器学习,多语言,文本分析,情感分析 数据概述: 该数据集来自 Jigsaw 竞赛,主要包含了经过翻译的评论文本,旨在用于多语言环境下的有害评论检测任务。主要特征如下:...
-
印度语文件数据集HindiLanguageFilesDataset-sherinkk
印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:...
-
开放助手对话数据集OASST1-SL-valterh
开放助手对话数据集OASST1-SL-valterh 数据来源:互联网公开数据 标签:对话数据,自然语言处理,机器学习,情感分析,文本生成,对话系统,开源,多语言 数据概述: 该数据集包含来自开放助手(Open Assistant)项目的对话数据,主要记录了用户与AI助手的多轮对话内容。主要特征如下:...
-
英语和印地语IMDb电影评分数据集EnglishandHindiIMDbMovieRatingsDataset-imjunias
英语和印地语IMDb电影评分数据集EnglishandHindiIMDbMovieRatingsDataset-imjunias 数据来源:互联网公开数据 标签:电影评分,数据集,IMDb,多语言,情感分析,机器学习,自然语言处理,数据挖掘 数据概述:...
-
情感分析多语言文本情绪数据集MultilingualTextEmotionAnalysisDataset-kuongan
情感分析多语言文本情绪数据集MultilingualTextEmotionAnalysisDataset-kuongan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 情绪识别, 情感词典, 机器学习, 自然语言处理, 语料库 数据概述:...
-
照片翻译数据集PHOMTTranslationDataset-baotanguyen
照片翻译数据集PHOMTTranslationDataset-baotanguyen 数据来源:互联网公开数据 标签:机器翻译,图像识别,数据集,多语言,计算机视觉,自然语言处理,人工智能,图像翻译 数据概述: 该数据集专注于照片翻译任务,包含大量带有文本信息的图像及其对应的翻译文本。主要特征如下:...
-
多语言问答文本数据集MultilingualQuestionAnsweringTextDataset-zacchaeus
多语言问答文本数据集MultilingualQuestionAnsweringTextDataset-zacchaeus 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 阅读理解, 机器阅读, 多语言, 文本标注, 数据集 数据概述: 该数据集包含来自多个来源的问答文本数据,旨在用于评估和训练多语言问答系统。主要特征如下:...
-
多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha
多语言语音指令识别与翻译数据集MultilingualSpeechCommandRecognitionandTranslationDataset-prianshujha 数据来源:互联网公开数据 标签:语音识别, 自然语言处理, 多语言, 语音翻译, 机器学习, 语料库, 印度语言, 声学模型 数据概述:...
-
语音识别训练数据集SpeechRecognitionTrainingDataset-ashmitsatpute
语音识别训练数据集SpeechRecognitionTrainingDataset-ashmitsatpute 数据来源:互联网公开数据 标签:语音识别, 语音数据, 自然语言处理, 声学模型, 文本转录, 数据清洗, 多语言, 情感分析 数据概述: 该数据集包含来自 Mozilla Common Voice...
-
印地语-英语文本情感分析数据集Hindi-EnglishTextSentimentAnalysis-rishikashili
印地语-英语文本情感分析数据集Hindi-EnglishTextSentimentAnalysis-rishikashili 数据来源:互联网公开数据 标签:情感分析, 文本分类, 印地语, 英语, 多语言, 自然语言处理, 语料库, 机器学习 数据概述: 该数据集包含来自互联网的印地语和英语文本数据,记录了文本的情感倾向。主要特征如下:...
-
新闻文章多语言情感分析数据集NewsArticlesMulti-languageSentimentAnalysis-osama39
新闻文章多语言情感分析数据集NewsArticlesMulti-languageSentimentAnalysis-osama39 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 新闻文章, 自然语言处理, 机器翻译, 数据集构建, 文本语料库 数据概述:...
-
孟加拉国历史文化图像问答数据集BangladeshHistoricalandCulturalImageQuestionAnsweringDataset-nisha0202
孟加拉国历史文化图像问答数据集BangladeshHistoricalandCulturalImageQuestionAnsweringDataset-nisha0202 数据来源:互联网公开数据 标签:图像问答, 文化遗产, 孟加拉国, 历史建筑, 图像识别, 自然语言处理, 多语言, 计算机视觉 数据概述:...
-
谷歌与Mozilla豪萨语音频数据集GoogleandMozillaHausaAudioDataset-horlawale
谷歌与Mozilla豪萨语音频数据集GoogleandMozillaHausaAudioDataset-horlawale 数据来源:互联网公开数据 标签:音频数据,豪萨语,自然语言处理,语音识别,机器学习,多语言,语音合成,人工智能 数据概述: 该数据集由谷歌和Mozilla联合提供,包含豪萨语的音频数据,记录了豪萨语的语音样本。主要特征如下:...
-
葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana
葡萄酒品鉴评论文本数据集WineTastingReviewTextDataset-statiana 数据来源:互联网公开数据 标签:葡萄酒, 品鉴, 评论, 文本分析, 自然语言处理, 多语言, 情感分析, 数据标注 数据概述: 该数据集包含来自多个来源的葡萄酒品鉴评论文本,记录了不同年份、不同葡萄酒的品鉴笔记。主要特征如下:...



