-
训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa
训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa 数据来源:互联网公开数据 标签:翻译,数据集,自然语言处理,机器学习,多语言,文本处理,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的翻译训练数据,记录了多种语言之间的翻译对。主要特征如下:... -
骨骼解剖与问答数据集SkeletalAnatomyQuestionAnsweringDataset-gokulkarthik
骨骼解剖与问答数据集SkeletalAnatomyQuestionAnsweringDataset-gokulkarthik 数据来源:互联网公开数据 标签:解剖学, 问答系统, 文本生成, 机器翻译, 知识图谱, 自然语言处理, 多语言, 数据集 数据概述:... -
多语言手写字符识别数据集MultilingualHandwrittenCharacterRecognitionDataset-oleksiichornyi
多语言手写字符识别数据集MultilingualHandwrittenCharacterRecognitionDataset-oleksiichornyi 数据来源:互联网公开数据 标签:手写字符识别, 图像识别, 深度学习, 字符分类, EMNIST, CoMNIST, Cyrillic, 机器学习, 数据集构建, 多语言 数据概述:... -
智能助手对话数据集Ar-ZhData-IntelligentAssistantConversationDataset-arsltata
智能助手对话数据集Ar-ZhData-IntelligentAssistantConversationDataset-arsltata 数据来源:互联网公开数据 标签:对话数据,自然语言处理,数据集,智能助手,机器学习,对话系统,多语言,人工智能 数据概述:该数据集包含来自智能助手的对话数据,记录了智能助手与用户之间的对话内容。主要特征如下:... -
印地语-英语新闻摘要数据集MediaSumHindi-EnglishDataset-gautamil
印地语-英语新闻摘要数据集MediaSumHindi-EnglishDataset-gautamil 数据来源:互联网公开数据 标签:新闻摘要,多语言,印地语,英语,自然语言处理,机器翻译,文本摘要,数据集 数据概述: 该数据集包含来自MediaSum项目的新闻摘要数据,主要记录了印地语和英语新闻文章及其对应的摘要。主要特征如下:... -
亚马逊商品评论多语言数据集AmazonMulti-LanguageProductReviewsDataset-nnn614
亚马逊商品评论多语言数据集AmazonMulti-LanguageProductReviewsDataset-nnn614 数据来源:互联网公开数据 标签:电商,评论数据,多语言,情感分析,自然语言处理,机器学习,用户行为分析,文本挖掘 数据概述:... -
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan
歌曲歌词翻译数据集LyricTranslationDataset-xiehayan 数据来源:互联网公开数据 标签:歌词,翻译,数据集,自然语言处理,机器翻译,文本分析,多语言,语言学 数据概述: 该数据集包含来自多个来源的歌曲歌词及其对应的翻译文本,旨在用于机器翻译、文本分析和多语言研究。主要特征如下:... -
多语言图像识别数据集MultilingualImageRecognitionDataset-maxbernard111
多语言图像识别数据集MultilingualImageRecognitionDataset-maxbernard111 数据来源:互联网公开数据 标签:图像识别, 多语言, 计算机视觉, 图像分类, 深度学习, 数据集, 图像处理, 文本识别 数据概述:... -
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh
游戏翻译语料库-中文-越南语对照数据集GameTranslationCorpus-Chinese-Vietnamese-trninh 数据来源:互联网公开数据 标签:机器翻译, 游戏翻译, 语言对, 中文, 越南语, 文本数据, 语料库, 多语言 数据概述:... -
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu 数据来源:互联网公开数据 标签:音乐风格,歌词分析,数据集,机器学习,文本分类,多语言,自然语言处理,数据挖掘 数据概述: 该数据集包含来自多种语言的歌曲歌词,主要用于音乐风格分类任务。主要特征如下:... -
多语言有毒评论数据集法语-西班牙语-德语训练集-larryfreeman
多语言有毒评论数据集法语-西班牙语-德语训练集-larryfreeman 数据来源:互联网公开数据 标签:自然语言处理,有毒评论,数据集,多语言,机器学习,文本分类,情感分析,数据挖掘 数据概述:该数据集包含来自互联网公开平台的多语言有毒评论数据,记录了法语、西班牙语和德语三种语言的有毒言论样本。主要特征如下:... -
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh
俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:... -
多语言新闻文章数据集Multi-NewsDataset-terrychanorg
多语言新闻文章数据集Multi-NewsDataset-terrychanorg 数据来源:互联网公开数据 标签:新闻,多语言,数据集,自然语言处理,文本摘要,机器翻译,信息检索,文本分析 数据概述: 该数据集包含来自不同语言的新闻文章,用于文本摘要和多语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围为不确定,取决于新闻来源的更新频率。... -
多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431
多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:... -
新冠疫情社交媒体文本分析数据集COVID-19SocialMediaTextAnalysisDataset-bugraayan1
新冠疫情社交媒体文本分析数据集COVID-19SocialMediaTextAnalysisDataset-bugraayan1 数据来源:互联网公开数据 标签:新冠疫情, 社交媒体, 文本分析, 多语言, 疫情传播, 舆情分析, 情感分析, 机器学习 数据概述:... -
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23
印地语-英语机器翻译Hinglish语料数据集Hindi-EnglishMachineTranslationHinglishCorpus-rohanjha23 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 印度语, 英语, Hinglish, 语料库, 语言模型 数据概述:... -
机器翻译训练与评估数据集NMTTranslationDataset-jeevats
机器翻译训练与评估数据集NMTTranslationDataset-jeevats 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,文本分析,多语言,深度学习,人工智能 数据概述: 该数据集包含用于机器翻译任务的双语平行文本数据,记录了源语言和目标语言之间的翻译对。主要特征如下:... -
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555
Jigsaw评论文本翻译数据集JigsawTrainTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:文本数据,翻译,评论,自然语言处理,机器学习,多语言,文本分析,情感分析 数据概述: 该数据集来自 Jigsaw 竞赛,主要包含了经过翻译的评论文本,旨在用于多语言环境下的有害评论检测任务。主要特征如下:... -
印度语文件数据集HindiLanguageFilesDataset-sherinkk
印度语文件数据集HindiLanguageFilesDataset-sherinkk 数据来源:互联网公开数据 标签:印度语,文本数据,数据集,自然语言处理,机器学习,语言研究,文本分析,多语言 数据概述: 该数据集包含来自印度语(Hindi)环境下的各类文本文件,记录了印度语在不同场景下的使用情况。主要特征如下:... -
开放助手对话数据集OASST1-SL-valterh
开放助手对话数据集OASST1-SL-valterh 数据来源:互联网公开数据 标签:对话数据,自然语言处理,机器学习,情感分析,文本生成,对话系统,开源,多语言 数据概述: 该数据集包含来自开放助手(Open Assistant)项目的对话数据,主要记录了用户与AI助手的多轮对话内容。主要特征如下:...