-
语言学习与自然语言处理数据集LangsData-LanguageLearningandNLPDataset-rookiejing
语言学习与自然语言处理数据集LangsData-LanguageLearningandNLPDataset-rookiejing 数据来源:互联网公开数据 标签:语言学习,自然语言处理,数据集,机器学习,翻译技术,文本分析,教育科技,多语言 数据概述:... -
阿姆哈拉语文本数据集AmharicDataDataset-azzaal
阿姆哈拉语文本数据集AmharicDataDataset-azzaal 数据来源:互联网公开数据 标签:阿姆哈拉语,文本数据,数据集,语言处理,自然语言处理,机器学习,多语言,非洲语言 数据概述: 该数据集包含来自公开来源的阿姆哈拉语文本数据,记录了阿姆哈拉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能涵盖多个时间段。... -
印地语验证标记数据集HindiValidationTokensDataset-pranav51286
印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:... -
跨语言希望语音检测数据集HopeSpeechDetectionAcrossMultipleLanguagesDataset-nomanjaffar11
跨语言希望语音检测数据集HopeSpeechDetectionAcrossMultipleLanguagesDataset-nomanjaffar11 数据来源:互联网公开数据 标签:语音识别,情感分析,多语言,数据集,自然语言处理,机器学习,仇恨言论检测,语音数据 数据概述:... -
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc 数据来源:互联网公开数据 标签:机器翻译,数据集,文本翻译,自然语言处理,英语,多语言,深度学习,NLP 数据概述: 该数据集包含了用于训练和评估多语言翻译模型(MT5)的英语翻译数据,专注于英语与其他语言之间的翻译。主要特征如下:... -
Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308
Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,情感分析,数据挖掘,多语言,文本标注 数据概述:... -
英语到阿坎特语单词翻译数据集English-to-Akan-Twi-WordsDataset-derrickzhen
英语到阿坎特语单词翻译数据集English-to-Akan-Twi-WordsDataset-derrickzhen 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,多语言,机器学习,文本分析,语言学习,翻译技术 数据概述: 该数据集包含来自英语到阿坎特语(Twi)的单词翻译记录,记录了两个语言之间的词汇对应关系。主要特征如下:... -
多语言问答数据集-TyDiQA可回答问题子集
多语言问答数据集-TyDiQA可回答问题子集 数据来源:互联网公开数据 标签:自然语言处理,NLP,问答系统,机器阅读理解,多语言,文本数据,AI,语言学,TydiQA,Hugging Face 数据概述: Answerable-TyDiQA数据集是TyDi QA数据集的子集,TyDi QA是一个涵盖11种语言的问答数据集。Answerable-... -
语言分类数据集LanguageClassificationDataset-jhaamanvaibhav
语言分类数据集LanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,自然语言处理,数据集,机器学习,文本分析,多语言,数据挖掘,文本分类 数据概述: 该数据集包含来自多个来源的语言分类数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:... -
日语平假名与越南语数据集Hiragana-Japanese-VietnameseDataset-flightstar
日语平假名与越南语数据集Hiragana-Japanese-VietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学习,数据集,平假名,越南语,字符识别,自然语言处理,机器学习,多语言 数据概述: 该数据集包含日语平假名与越南语的相关数据,记录了两种语言之间的对应关系和语言特征。主要特征如下:... -
社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach
社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach 数据来源:互联网公开数据 标签:图像描述,翻译,社交媒体,数据集,自然语言处理,机器翻译,多语言,计算机视觉 数据概述:该数据集包含来自Flickr平台的图片及其描述,并提供了相应描述的尼泊尔语翻译。主要特征如下:... -
维基多语言文本分类数据集-2018
维基多语言文本分类数据集-2018 数据来源:互联网公开数据 标签:文本分类,多语言,自然语言处理,机器学习,语言识别,维基百科,NLP,数据集 数据概述:... -
多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta
多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta 数据来源:互联网公开数据 标签:机器学习,自然语言处理,阅读理解,多语言,印地语,问答系统,数据集,人工智能 数据概述:... -
Twitter情绪分类数据集英语-印尼语Twitter情绪分类数据集英语-印尼语-uom200088d
Twitter情绪分类数据集英语-印尼语Twitter情绪分类数据集英语-印尼语-uom200088d 数据来源:互联网公开数据 标签:情绪分类,社交媒体,数据集,机器学习,自然语言处理,文本分析,情感分析,多语言 数据概述:该数据集包含来自Twitter的推文,记录了用户的英语和印尼语推文及其对应的情绪标签。主要特征如下:... -
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance... -
自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365
自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,机器学习,文本分析,人工智能,语言模型,语义理解 数据概述: 该数据集包含来自多个语言的自然语言处理数据,记录了不同语言的文本内容及其相关信息。主要特征如下:... -
英语到希伯来语圣经翻译数据集English-to-HebrewBibleTranslationsDataset-williamalabi
英语到希伯来语圣经翻译数据集English-to-HebrewBibleTranslationsDataset-williamalabi 数据来源:互联网公开数据 标签:圣经翻译,语言学,数据集,机器翻译,文本分析,宗教研究,自然语言处理,多语言 数据概述: 该数据集包含英语到希伯来语的圣经翻译文本,记录了圣经经文的双语对照内容。主要特征如下:... -
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth
英语-豪萨语翻译语料库数据集English-HausaTranslationCorpusDataset-gigikenneth 数据来源:互联网公开数据 标签:语言翻译,语料库,自然语言处理,多语言,机器翻译,文本分析,语言资源,人工智能 数据概述: 该数据集包含来自英语到豪萨语的平行语料,记录了双语文本对,适用于机器翻译和语言学研究。主要特征如下:... -
马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav
马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:... -
金融新闻情感分析数据集FinancialPhraseBankPortugueseTranslationDataset-pixeldust64
金融新闻情感分析数据集FinancialPhraseBankPortugueseTranslationDataset-pixeldust64 数据来源:互联网公开数据 标签:金融新闻,情感分析,数据集,自然语言处理,机器学习,文本分类,多语言,葡萄牙语 数据概述:...