找到667个数据集

标签: 语言学

过滤结果
  • 马拉地语文本情感分析数据集MarathiTextSentimentAnalysisDataset-suramyajadhav

    2025年4月24日   

    马拉地语文本情感分析数据集MarathiTextSentimentAnalysisDataset-suramyajadhav 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,马拉地语,文本挖掘,机器学习,语言学,印度文化 数据概述: 该数据集包含了马拉地语文本及其对应的情感标签,用于情感分析模型的训练和评估。主要特征如下:...
    packageimg
  • 阿塞拜疆语词汇库数据集-slyce20

    2025年4月24日   

    阿塞拜疆语词汇库数据集-slyce20 数据来源:互联网公开数据 标签:阿塞拜疆语,词汇,语言学,文本数据,语料库,自然语言处理,词典 数据概述: 本数据集包含8.2万个阿塞拜疆语单词,构成了一个基础的词汇库。数据集涵盖了阿塞拜疆语的常用词汇,为语言研究和相关应用提供了基础数据。 数据用途概述:...
    packageimg
  • 古兰经文本与地点数据集2023数据集-abdulbaqi

    2025年4月23日   

    古兰经文本与地点数据集2023数据集-abdulbaqi 数据来源:互联网公开数据 标签:古兰经,文本分析,宗教研究,数据集,伊斯兰教,文化研究,文本挖掘,语言学 数据概述:该数据集包含来自公开来源的古兰经文本数据,记录了古兰经章节及其对应内容,并标注了其在伊斯兰教历史和文化中的重要地点。主要特征如下:...
    packageimg
  • 印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3

    2025年4月23日   

    印尼语语料库文本数据集LanguageSetfromKorpusNusantara-ahmdfkhr3 数据来源:互联网公开数据 标签:印尼语,语料库,文本数据,自然语言处理,语言学,词汇分析,文本挖掘,机器学习 数据概述: 该数据集收录了来自印尼语语料库 Nusantara (Korpus Nusantara)...
    packageimg
  • 波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian

    2025年4月23日   

    波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,文本翻译,语言学,验证 数据概述: 该数据集包含来自Parsinlu项目,用于验证波斯语到英语翻译模型的性能。主要特征如下:...
    packageimg
  • 乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan

    2025年4月23日   

    乌尔都语罗马转写文本数据集UCIRomanUrduDataset-athirakaladharan 数据来源:互联网公开数据 标签:自然语言处理,文本分析,乌尔都语,罗马转写,情感分析,机器学习,语言学,数据集 数据概述: 该数据集来自加州大学欧文分校(UCI),包含了乌尔都语的罗马转写文本数据,主要用于自然语言处理和文本分析研究。主要特征如下:...
    packageimg
  • 英语翻译数据集EnglishTranslatedDataset-tasnim34

    2025年4月23日   

    英语翻译数据集EnglishTranslatedDataset-tasnim34 数据来源:互联网公开数据 标签:英语翻译,数据集,自然语言处理,机器学习,文本分析,语言学,学术研究,语言技术 数据概述:该数据集包含来自多个来源的英语翻译文本数据,记录了原文本及其翻译版本。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 阿萨姆语情感分析数据集AssameseSentimentsDataset-ritikjain00

    2025年4月23日   

    阿萨姆语情感分析数据集AssameseSentimentsDataset-ritikjain00 数据来源:互联网公开数据 标签:情感分析,阿萨姆语,自然语言处理,数据集,文本分类,机器学习,语言学,印度 数据概述: 该数据集包含来自互联网的阿萨姆语文本数据,用于情感分析任务,记录了阿萨姆语文本的情感倾向。主要特征如下:...
    packageimg
  • 标注词语数据集AnnotatedWordsDataset-abdelhakch

    2025年4月23日   

    标注词语数据集AnnotatedWordsDataset-abdelhakch 数据来源:互联网公开数据 标签:词语标注,自然语言处理,数据集,文本分析,机器学习,语言学,词性标注,学术研究 数据概述:该数据集包含来自互联网公开资源的词语标注数据,记录了词语的详细信息及其在文本中的作用。主要特征如下:...
    packageimg
  • 波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei

    2025年4月23日   

    波斯语语言与文本数据集PersianLanguageandTextDataset-mohsenmirzaei 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,文本分析,机器学习,波斯语,文本分类,多语言处理 数据概述: 该数据集包含来自波斯语互联网和公开文本资源的数据,记录了波斯语的语言文本和结构特征。主要特征如下:...
    packageimg
  • 文本摘要生成数据集SESummarizationDataset-rahulshelke98

    2025年4月23日   

    文本摘要生成数据集SESummarizationDataset-rahulshelke98 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器学习,信息检索,文本挖掘,语言学,数据科学 数据概述:该数据集包含来自Stack...
    packageimg
  • 土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr

    2025年4月23日   

    土耳其语通用依存树库数据集TurkishUniversalDependenciesDataset-emirkaanozdemr 数据来源:互联网公开数据 标签:语言学,依存句法,自然语言处理,土耳其语,数据集,句法分析,语言资源,机器学习 数据概述: 该数据集包含土耳其语的通用依存树库,记录了土耳其语文本的依存句法结构。主要特征如下:...
    packageimg
  • 泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420

    2025年4月23日   

    泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
    packageimg
  • 瑞典语情感分析数据集-wlinds

    2025年4月23日   

    瑞典语情感分析数据集-wlinds 数据来源:互联网公开数据 标签:情感分析,瑞典语,自然语言处理,文本挖掘,数据集,情感分类,语言学,机器学习 数据概述: 该数据集包含了瑞典语文本,用于情感分析任务。主要特征如下: 时间跨度: 数据记录的时间范围不定,主要取决于数据来源。 地理范围: 数据主要来源于瑞典。 数据维度:...
    packageimg
  • 数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy

    2025年4月23日   

    数字马拉雅拉姆语言数据集DigitalMalayalamLanguageDataset-amaljossy 数据来源:互联网公开数据 标签:数字语言,马拉雅拉姆,数据集,自然语言处理,文本分析,机器学习,语言学,人工智能 数据概述: 该数据集包含来自互联网和公开资源的马拉雅拉姆语言文本数据,记录了各种类型的马拉雅拉姆文本。主要特征如下:...
    packageimg
  • 双语样本数据集BitextSampleDataset-pragadeeshn01

    2025年4月23日   

    双语样本数据集BitextSampleDataset-pragadeeshn01 数据来源:互联网公开数据 标签:双语文本,数据集,自然语言处理,机器学习,翻译,语言学,文本分析,人工智能 数据概述: 该数据集包含来自不同来源的双语文本样本数据,主要用于机器翻译,文本对齐和自然语言处理研究。主要特征如下:...
    packageimg
  • 越南语文本分类数据集-trnthinph

    2025年4月23日   

    越南语文本分类数据集-trnthinph 数据来源:互联网公开数据 标签:越南语,文本分类,自然语言处理,数据集,情感分析,语言学,机器学习,文本挖掘 数据概述: 该数据集包含越南语文本数据,并按照不同的类别进行标注。主要特征如下: 时间跨度:数据记录的时间范围无明确限制,取决于文本的发布时间。...
    packageimg
  • 多语言标记数据集MultilangTokensDataset-pranav51286

    2025年4月23日   

    多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:...
    packageimg
  • 文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni

    2025年4月23日   

    文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni 数据来源:互联网公开数据 标签:文本可读性,数据集,自然语言处理,机器学习,教育,阅读理解,文本分析,语言学...
    packageimg
  • 沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy

    2025年4月23日   

    沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy 数据来源:互联网公开数据 标签:机器翻译,文本对比,数据集,自然语言处理,深度学习,文本分析,翻译质量,语言学 数据概述: 该数据集包含由IBM...
    packageimg