-
马拉地语文本情感分析数据集MarathiTextSentimentAnalysisDataset-suramyajadhav
马拉地语文本情感分析数据集MarathiTextSentimentAnalysisDataset-suramyajadhav 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,马拉地语,文本挖掘,机器学习,语言学,印度文化 数据概述: 该数据集包含了马拉地语文本及其对应的情感标签,用于情感分析模型的训练和评估。主要特征如下:... -
阿塞拜疆语词汇库数据集-slyce20
阿塞拜疆语词汇库数据集-slyce20 数据来源:互联网公开数据 标签:阿塞拜疆语,词汇,语言学,文本数据,语料库,自然语言处理,词典 数据概述: 本数据集包含8.2万个阿塞拜疆语单词,构成了一个基础的词汇库。数据集涵盖了阿塞拜疆语的常用词汇,为语言研究和相关应用提供了基础数据。 数据用途概述:... -
古兰经文本与地点数据集2023数据集-abdulbaqi
古兰经文本与地点数据集2023数据集-abdulbaqi 数据来源:互联网公开数据 标签:古兰经,文本分析,宗教研究,数据集,伊斯兰教,文化研究,文本挖掘,语言学 数据概述:该数据集包含来自公开来源的古兰经文本数据,记录了古兰经章节及其对应内容,并标注了其在伊斯兰教历史和文化中的重要地点。主要特征如下:... -
印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3
印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3 数据来源:互联网公开数据 标签:印尼语,语料库,文本数据,自然语言处理,语言学,词汇分析,文本挖掘,机器学习 数据概述: 该数据集收录了来自印尼语语料库 Nusantara (Korpus Nusantara)... -
波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian
波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,文本翻译,语言学,验证 数据概述: 该数据集包含来自Parsinlu项目,用于验证波斯语到英语翻译模型的性能。主要特征如下:... -
乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan
乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,罗马转写,情感分析,机器学习,语言学,数据集 数据概述: 该数据集来自加州大学欧文分校(UCI),包含了乌尔都语的罗马转写文本数据,主要用于自然语言处理和文本分析研究。主要特征如下:... -
英语翻译数据集EnglishTranslatedDataset-tasnim34
英语翻译数据集EnglishTranslatedDataset-tasnim34 数据来源:互联网公开数据 标签:英语翻译,数据集,自然语言处理,机器学习,文本分析,语言学,学术研究,语言技术 数据概述:该数据集包含来自多个来源的英语翻译文本数据,记录了原文本及其翻译版本。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
阿萨姆语情感分析数据集AssameseSentimentsDataset-ritikjain00
阿萨姆语情感分析数据集AssameseSentimentsDataset-ritikjain00 数据来源:互联网公开数据 标签:情感分析,阿萨姆语,自然语言处理,数据集,文本分类,机器学习,语言学,印度 数据概述: 该数据集包含来自互联网的阿萨姆语文本数据,用于情感分析任务,记录了阿萨姆语文本的情感倾向。主要特征如下:... -
标注词语数据集AnnotatedWordsDataset-abdelhakch
标注词语数据集AnnotatedWordsDataset-abdelhakch 数据来源:互联网公开数据 标签:词语标注,自然语言处理,数据集,文本分析,机器学习,语言学,词性标注,学术研究 数据概述:该数据集包含来自互联网公开资源的词语标注数据,记录了词语的详细信息及其在文本中的作用。主要特征如下:... -
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei
波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:... -
文本摘要生成数据集SESummarizationDataset-rahulshelke98
文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack... -
土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr
土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:语言学,依存句法,自然语言处理,土耳其语,数据集,句法分析,语言资源,机器学习 数据概述: 该数据集包含土耳其语的通用依存树库,记录了土耳其语文本的依存句法结构。主要特征如下:... -
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:... -
瑞典语情感分析数据集-wlinds
瑞典语情感分析数据集-wlinds 数据来源:互联网公开数据 标签:情感分析,瑞典语,自然语言处理,文本挖掘,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含了瑞典语文本,用于情感分析任务。主要特征如下: 时间跨度: 数据记录的时间范围不定,主要取决于数据来源。 地理范围: 数据主要来源于瑞典。 数据维度:... -
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy
数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy 数据来源:互联网公开数据 标签:数字语言,马拉雅拉姆,数据集,自然语言处理,文本分析,机器学习,语言学,人工智能 数据概述: 该数据集包含来自互联网和公开资源的马拉雅拉姆语言文本数据,记录了各种类型的马拉雅拉姆文本。主要特征如下:... -
双语样本数据集BitextSampleDataset-pragadeeshn01
双语样本数据集BitextSampleDataset-pragadeeshn01 数据来源:互联网公开数据 标签:双语文本,数据集,自然语言处理,机器学习,翻译,语言学,文本分析,人工智能 数据概述: 该数据集包含来自不同来源的双语文本样本数据,主要用于机器翻译,文本对齐和自然语言处理研究。主要特征如下:... -
越南语文本分类数据集-trnthinph
越南语文本分类数据集-trnthinph 数据来源:互联网公开数据 标签:越南语,文本分类,自然语言处理,数据集,情感分析,语言学,机器学习,文本挖掘 数据概述: 该数据集包含越南语文本数据,并按照不同的类别进行标注。主要特征如下: 时间跨度:数据记录的时间范围无明确限制,取决于文本的发布时间。... -
多语言标记数据集MultilangTokensDataset-pranav51286
多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:... -
文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni
文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni 数据来源:互联网公开数据 标签:文本可读性,数据集,自然语言处理,机器学习,教育,阅读理解,文本分析,语言学... -
沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy
沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy 数据来源:互联网公开数据 标签:机器翻译,文本对比,数据集,自然语言处理,深度学习,文本分析,翻译质量,语言学 数据概述: 该数据集包含由IBM...