-
基尼瓦尔语对话数据集KinyarwandaConversationDatasets-iranzidev
基尼瓦尔语对话数据集KinyarwandaConversationDatasets-iranzidev 数据来源:互联网公开数据 标签:基尼瓦尔语,对话数据,自然语言处理,语音识别,多语言,机器学习,语言资源,非洲语言 数据概述: 该数据集包含来自基尼瓦尔语(卢旺达官方语言之一)的对话数据,记录了基尼瓦尔语的口语交流内容。主要特征如下:... -
希伯来文化平台科技文化视角多语言平行文本数据集
希伯来文化平台科技文化视角多语言平行文本数据集 数据来源:互联网公开数据 标签:平行文本,多语言,希伯来语,文化,科技,HTML,文本挖掘,机器翻译,语料库 数据概述: 本数据集收录了来自以色列领先的希伯来文化平台Hitdarderut... -
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban
BBC新闻多语言数据集BBCNews8LanguagesDataset-irenemarban 数据来源:互联网公开数据 标签:新闻,多语言,数据集,文本分析,自然语言处理,机器学习,翻译,信息提取 数据概述: 该数据集包含来自BBC新闻网站的多语言新闻文本数据,记录了不同语言版本的新闻文章内容。主要特征如下:... -
自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss
自然语言处理多分类任务BERT多语言数据集NLP多分类任务BERT多语言数据集-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,BERT,数据集,多语言,文本分析,机器学习,深度学习 数据概述:该数据集包含来自多个语言来源的文本数据,适用于自然语言处理中的多分类任务。主要特征如下:... -
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki
阿法奥罗莫语维基百科数据集AfaanOromoWikipediaDataset-beknanchemedabeki 数据来源:互联网公开数据 标签:维基百科,语言资源,数据集,自然语言处理,文本挖掘,多语言,人工智能,语言学 数据概述: 该数据集包含来自阿法奥罗莫语维基百科的文本数据,记录了阿法奥罗莫语维基百科的完整内容。主要特征如下:... -
土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin
土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻分析,数据集,自然语言处理,文本分类,机器学习,新闻媒体,土耳其,多语言 数据概述: 该数据集包含来自土耳其知名新闻媒体Son D News的新闻文章数据,记录了该媒体发布的新闻内容。主要特征如下:... -
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg
基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:... -
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:... -
斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras
斯拉夫语言有毒评论数据集ToxicCommentswithSlavicDataset-mykras 数据来源:互联网公开数据 标签:文本分析,有害内容,数据集,自然语言处理,机器学习,情感分析,多语言,斯拉夫语言 数据概述:... -
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy
合并的Dataverse语言识别数据集MergedDataverseBhashaLanguageRecognitionDataset-samansarkerjoy 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,语音识别,多语言,人工智能,数据分析 数据概述:... -
国籍分类数据集NationalityClassificationDataset-gauravduttakiit
国籍分类数据集NationalityClassificationDataset-gauravduttakiit 数据来源:互联网公开数据 标签:国籍分类,数据集,机器学习,文本分析,自然语言处理,数据挖掘,人工智能,多语言 数据概述: 该数据集包含来自互联网公开来源的国籍分类数据,记录了不同国籍的身份标识信息。主要特征如下:... -
亚马逊Prime视频多语言电影数据集AmazonPrimeVideoMulti-LanguageMovieDataset-abilashpothakanuri
亚马逊Prime视频多语言电影数据集AmazonPrimeVideoMulti-LanguageMovieDataset-abilashpothakanuri 数据来源:互联网公开数据 标签:影视数据,多语言,数据集,电影分析,流媒体,内容推荐,数据挖掘,机器学习 数据概述:... -
亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998
亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998 数据来源:互联网公开数据 标签:电商,商品评论,自然语言处理,多语言,情感分析,机器学习,文本分析,亚马逊 数据概述: 该数据集由亚马逊提供,包含了来自亚马逊平台的商品评论数据,覆盖多种语言。主要特征如下:... -
多语言文本数据集Multi-LanguageTextDataset-farouqalzeer
多语言文本数据集Multi-LanguageTextDataset-farouqalzeer 数据来源:互联网公开数据 标签:多语言,文本数据,自然语言处理,数据集,机器学习,文本分类,语言翻译,语言技术 数据概述: 该数据集包含来自多个不同语言的文本数据,记录了多种语言的自然语言文本内容。主要特征如下: 时间跨度:... -
多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan
多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan 数据来源:互联网公开数据 标签:多语言,文本分析,情绪识别,情感计算,自然语言处理,机器学习,心理学,数据集 数据概述:该数据集包含来自多个来源的多语言文本数据,记录了不同语言文本中的情绪标注。主要特征如下:... -
泰米尔语开放域问答数据集TamilOdqaDataset-aswin037
泰米尔语开放域问答数据集TamilOdqaDataset-aswin037 数据来源:互联网公开数据 标签:泰米尔语,开放域问答,数据集,自然语言处理,机器学习,文本理解,问答系统,多语言 数据概述: 该数据集包含来自泰米尔语的开放域问答数据,记录了泰米尔语文本及其对应的问答对。主要特征如下:... -
机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876
机器翻译与文本对齐数据集MyDearWatsonBacktranslatedDataset-leoxu1243876 数据来源:互联网公开数据 标签:机器翻译,文本对齐,数据集,自然语言处理,多语言,深度学习,数据增强,语言模型 数据概述:该数据集包含来自 My Dear Watson... -
多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction
多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction 数据来源:互联网公开数据 标签:语言学,多语言,词汇数据集,自然语言处理,翻译研究,语言对比,数据科学,教育技术 数据概述: 该数据集包含来自100种不同语言的常用词汇数据,记录了各语言中的基础词汇及其对应翻译。主要特征如下:... -
多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang
多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:... -
法语智能助手训练数据集FinaleAIFrenchDataset-waelfezari
法语智能助手训练数据集FinaleAIFrenchDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,语言模型,多语言,教育技术,智能助手 数据概述: 该数据集包含用于训练法语智能助手的多语言对话数据,记录了用户与AI助手之间的交互内容。主要特征如下:...