找到667个数据集

标签: 语言学

过滤结果
  • 荷兰谚语数据集DutchProverbsDataset-levrex

    2025年4月23日   

    荷兰谚语数据集DutchProverbsDataset-levrex 数据来源:互联网公开数据 标签:谚语,数据集,语言学,文化研究,荷兰语,智慧,民俗学,社会学 数据概述:该数据集包含来自荷兰的谚语,记录了荷兰人民世代相传的智慧和经验。主要特征如下: 时间跨度:数据记录的时间范围从16世纪到现代。 地理范围:数据涵盖了荷兰全国及部分荷兰海外社区。...
    packageimg
  • 阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache

    2025年4月23日   

    阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache 数据来源:互联网公开数据 标签:阿拉伯语,文本可读性,文本摘要,自然语言处理,语言学,数据集,机器翻译,深度学习 数据概述: 该数据集包含阿拉伯语文本,用于研究阿拉伯语文本的可读性和文本摘要。主要特征如下: 时间跨度: 数据记录的时间范围不明确,数据本身为静态文本集合。 地理范围:...
    packageimg
  • 阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge

    2025年4月23日   

    阿拉伯语文本摘要基准数据集ArabicSummarizationBenchmarkDataset-bavlygeorge 数据来源:互联网公开数据 标签:阿拉伯语,文本摘要,数据集,自然语言处理,机器学习,语言学,信息检索,翻译 数据概述: 该数据集包含来自多个来源的阿拉伯语文本数据,旨在用于文本摘要任务的评估和研究。主要特征如下:...
    packageimg
  • 讽刺文本评价数据集-kolliparajaswanth030

    2025年4月23日   

    讽刺文本评价数据集-kolliparajaswanth030 数据来源:互联网公开数据 标签:讽刺检测,情感分析,自然语言处理,文本分析,数据集,机器学习,语言学,文本分类 数据概述: 该数据集包含了用于讽刺文本评价的文本数据,旨在帮助研究人员和开发者构建和评估讽刺检测模型。主要特征如下: 时间跨度:数据收集时间不限,反映了不同时期和语境下的讽刺表达。...
    packageimg
  • 诺维雅语料库数据集NoviaKorpusDataset-noviafadina

    2025年4月23日   

    诺维雅语料库数据集NoviaKorpusDataset-noviafadina 数据来源:互联网公开数据 标签:语料库,语言学,文本分析,自然语言处理,芬兰语,数据集,文本挖掘,词汇研究 数据概述: 该数据集包含来自诺维雅应用科学大学(Novia University of Applied...
    packageimg
  • 词汇索引数据集WordIndexesDataset-virenmohanlal

    2025年4月23日   

    词汇索引数据集WordIndexesDataset-virenmohanlal 数据来源:互联网公开数据 标签:语言学,词汇索引,数据集,文本分析,自然语言处理,教育研究,数据挖掘,语言学习 数据概述: 该数据集包含词汇索引数据,记录了词汇的索引,频率,词性等信息。主要特征如下: 时间跨度:数据记录的时间范围未明确说明,可能覆盖多个时间段。...
    packageimg
  • 英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai

    2025年4月23日   

    英语句子语义相似度测试数据集EN-STS-TestDataset-dangthai 数据来源:互联网公开数据 标签:自然语言处理,语义相似度,数据集,文本分析,机器学习,NLP,语言学,评估 数据概述: 该数据集包含用于评估英语句子语义相似度的测试数据。主要特征如下: 时间跨度: 数据记录的时间范围为数据集发布时间。 地理范围:...
    packageimg
  • 土耳其高级政治词汇数据集TurkishAdvancedPoliticsVocabularyDataset-mythereus

    2025年4月23日   

    土耳其高级政治词汇数据集TurkishAdvancedPoliticsVocabularyDataset-mythereus 数据来源:互联网公开数据 标签:政治词汇,高级词汇,数据集,语言学,社会科学,土耳其语,教育,词汇学习 数据概述: 该数据集包含来自土耳其公开资源的高级政治词汇数据,记录了与政治领域相关的复杂和高级词汇。主要特征如下:...
    packageimg
  • 世界语言灭绝风险分类数据集-gauravduttakiit

    2025年4月23日   

    世界语言灭绝风险分类数据集-gauravduttakiit 数据来源:互联网公开数据 标签:语言灭绝,UNESCO,语言保护,语言学,语言分类,濒危语言,语言多样性,文化传承,技术应用 数据概述:...
    packageimg
  • 波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151

    2025年4月23日   

    波斯语Farsi文本情感分析数据集PersianFarsiTextSentimentDataset-alireza151 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,语言学,情感挖掘,波斯语 数据概述:...
    packageimg
  • 法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo

    2025年4月23日   

    法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo 数据来源:互联网公开数据 标签:法语,俚语,翻译,自然语言处理,LLM,Gemma,模型训练,文本数据,语言学,KAIra,文本生成 数据概述:...
    packageimg
  • 汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29

    2025年4月23日   

    汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing

    2025年4月23日   

    葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:...
    packageimg
  • 词频统计数据集WordFrequenciesDataset-patricknormile

    2025年4月23日   

    词频统计数据集WordFrequenciesDataset-patricknormile 数据来源:互联网公开数据 标签:文本分析,词频统计,自然语言处理,数据集,数据挖掘,语言学,机器学习,文本预处理 数据概述: 该数据集包含来自多个文本来源的词频统计数据,记录了不同语料库中单词出现的频率。主要特征如下:...
    packageimg
  • 孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir

    2025年4月23日   

    孟加拉语词汇数据集BanglaWordsDataset2-mdabrarshahriarkabir 数据来源:互联网公开数据 标签:语言学,词汇,数据集,文本分析,自然语言处理,语言研究,机器学习,教育 数据概述: 该数据集包含来自孟加拉语词汇库的数据,记录了孟加拉语词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 辩论场景句子数据集DebateSentencesDataset-vdudani

    2025年4月23日   

    辩论场景句子数据集DebateSentencesDataset-vdudani 数据来源:互联网公开数据 标签:辩论,句子,文本分析,自然语言处理,数据集,情感分析,语言学,机器学习 数据概述: 该数据集包含了从公开辩论场景中提取的句子,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的辩论场景。...
    packageimg
  • 英法语言对比数据集EnglishandFrenchLanguageComparisonDataset-jayantiprasad

    2025年4月23日   

    英法语言对比数据集EnglishandFrenchLanguageComparisonDataset-jayantiprasad 数据来源:互联网公开数据 标签:语言学,数据集,对比分析,翻译,自然语言处理,机器学习,学术资源,语言研究 数据概述:该数据集包含来自互联网的英法语言对比数据,记录了英语和法语在词汇,语法,语义等方面的不同点。主要特征如下:...
    packageimg
  • 词典数据集LexiconDataDataset-cakrulgaming

    2025年4月23日   

    词典数据集LexiconDataDataset-cakrulgaming 数据来源:互联网公开数据 标签:词典,数据集,自然语言处理,语言学,词汇研究,文本分析,教育,机器学习 数据概述: 该数据集包含来自多个来源的词典数据,记录了大量词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 阿加乌格纳手写字符识别数据集

    2025年4月23日   

    阿加乌格纳手写字符识别数据集 数据来源:互联网公开数据 标签:手写字符, 阿加乌格纳, 字符识别, 图像识别, 语言学, 机器学习, 数据集, 少数民族语言 数据概述: 本数据集包含阿加乌格纳(Agawugna)手写字符的图像数据,旨在为研究人员提供一个用于字符识别和机器学习的资源。...
    packageimg
  • 数据10000条样本语言识别数据集-amitverma2030

    2025年4月23日   

    10000条样本语言识别数据集-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,文本分类,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含10000条文本样本,用于语言识别任务。主要特征如下: 时间跨度:数据无明确的时间范围,为静态数据集。 地理范围:数据涵盖多种语言,文本来源多样。...
    packageimg