找到676个数据集

标签: 语言学

过滤结果
  • 机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy

    2025年5月29日   

    机器翻译越-英平行语料库数据集MachineTranslationVietnamese-EnglishParallelCorpus-saisrinivasreddy 数据来源:互联网公开数据 标签:机器翻译, 越南语, 英语, 平行语料库, 自然语言处理, 文本翻译, 数据集, 语言学 数据概述: 该数据集包含越南语-...
    packageimg
  • 数据2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong

    2025年5月29日   

    2024年互联网文本语料库1024-corpus-2024年互联网文本语料库-dinhnhattruong 数据来源:互联网公开数据 标签:互联网文本,自然语言处理,语料库,大数据,机器学习,文本分析,人工智能,语言学 数据概述:该数据集为2024年互联网公开的文本数据,涵盖了广泛的互联网文本资源,适用于自然语言处理、文本分析等任务。主要特征如下:...
    packageimg
  • 文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh

    2025年5月29日   

    文字限制采样数据集SampledDataWordLimit190Dataset-amrkhaledsaleh 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,机器学习,语言学,文本挖掘,文本分类,文本预处理 数据概述:该数据集包含了经过采样的文本数据,每段文本的字数限制在190字内,适用于自然语言处理和文本分析任务。主要特征如下:...
    packageimg
  • 学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990

    2025年5月29日   

    学生写作水平评估文本数据集StudentWritingProficiencyTextDataset-rohitsingh9990 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 语言学, 文本分类, 机器学习, 写作质量, 文本特征 数据概述: 该数据集包含学生写作文本,用于评估学生的写作水平。主要特征如下:...
    packageimg
  • 佩什瓦文献英译数据集Peshwa文献英译数据集-devavratsamak

    2025年5月29日   

    佩什瓦文献英译数据集Peshwa文献英译数据集-devavratsamak 数据来源:互联网公开数据 标签:文献翻译,数据集,英译本,马拉地语,历史研究,语言学,文献学,文化研究 数据概述:该数据集包含佩什瓦文献的英译本,记录了17世纪至19世纪马拉地地区佩什瓦王朝的历史文献及其英文翻译。主要特征如下:...
    packageimg
  • 泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu

    2025年5月29日   

    泰卢固语图书数据集TeluguBooksDataset-vishnugandavarapu 数据来源:互联网公开数据 标签:泰卢固语,图书,数据集,语言学,文化研究,文本分析,机器学习,数字资源 数据概述: 该数据集包含来自互联网的泰卢固语图书数据,记录了泰卢固语文学作品的相关信息。主要特征如下: 时间跨度:数据记录的时间范围从19世纪至今。...
    packageimg
  • 阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal

    2025年5月29日   

    阿拉伯语文本对比分析数据集ArabicTextComparativeAnalysisDataset-ynawal 数据来源:互联网公开数据 标签:阿拉伯语, 文本分析, 文本对比, 自然语言处理, 语言学, 语料库, 文本挖掘, 语义分析 数据概述: 该数据集包含来自不同来源的阿拉伯语文本,记录了用于文本对比分析的语料。主要特征如下:...
    packageimg
  • 英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar

    2025年5月29日   

    英印翻译对照数据集SamanantarEnglishtoHindiDataset1-manavsarkar 数据来源:互联网公开数据 标签:英印翻译,数据集,自然语言处理,机器翻译,语言学,人工智能,文本分析,语料库 数据概述: 该数据集包含来自Samanantar项目的英印翻译对照数据,记录了英文原文及其对应的印地文翻译。主要特征如下:...
    packageimg
  • 俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh

    2025年5月29日   

    俄语与越南语文本语料库RussianandVietnameseTextCorpus-nguyntunsinh 数据来源:互联网公开数据 标签:文本语料库, 俄语, 越南语, 文本分析, 自然语言处理, 语言学, 多语言, 文本挖掘 数据概述: 该数据集包含来自互联网的俄语和越南语文本语料,主要用于语言学研究、自然语言处理模型的训练与评估。主要特征如下:...
    packageimg
  • 斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel

    2025年4月29日   

    斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-mikemollel 数据来源:互联网公开数据 标签:斯瓦希里语, 文本分类, 新闻, 多标签分类, 语言学, 自然语言处理, 机器学习, 语料库 数据概述:...
    packageimg
  • LJ语音数据集LJSpeechDataset-preranaraom

    2025年5月29日   

    LJ语音数据集LJSpeechDataset-preranaraom 数据来源:互联网公开数据 标签:语音识别,语音合成,数据集,自然语言处理,深度学习,语音处理,音频分析,语言学 数据概述: 该数据集包含来自LibriVox项目的一位女性读者的语音录音,主要用于语音合成和语音识别研究。主要特征如下: 时间跨度:数据记录的时间范围为1960年代。...
    packageimg
  • 多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431

    2025年5月29日   

    多语言词对翻译数据集MultilingualWordPairTranslationDataset-jaswanth431 数据来源:互联网公开数据 标签:机器翻译, 词对翻译, 多语言, 文本数据, 印度语言, 文本分析, 自然语言处理, 语言学 数据概述: 该数据集包含来自不同印度语言的词对翻译数据,旨在促进多语言翻译模型的研究与开发。主要特征如下:...
    packageimg
  • 印度尼西亚新闻数据集2-2020年IndonesianNewsDataset2-2020-alvonsukardi

    2025年5月29日   

    印度尼西亚新闻数据集2-2020年IndonesianNewsDataset2-2020-alvonsukardi 数据来源:互联网公开数据 标签:印尼新闻,数据集,自然语言处理,文本分析,机器学习,社会研究,媒体分析,语言学 数据概述:该数据集包含来自印度尼西亚各大媒体平台的新闻数据,记录了2020年全年发布的新闻文章。主要特征如下:...
    packageimg
  • 马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111

    2025年5月29日   

    马拉雅拉姆字符集数据集MalayalamCharacterSetDataset-raven111 数据来源:互联网公开数据 标签:马拉雅拉姆字符,数据集,语言学,字符识别,机器学习,自然语言处理,学术资源,多语言支持 数据概述: 该数据集包含来自互联网公开资源的马拉雅拉姆字符集,记录了马拉雅拉姆语的各种字符及其相关信息。主要特征如下: 时间跨度:...
    packageimg
  • 英语到印地语翻译数据集English-to-HindiTranslationDataset-rkumarbengaluru

    2025年5月29日   

    英语到印地语翻译数据集English-to-HindiTranslationDataset-rkumarbengaluru 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言转换,印地语,英语,文本分析,语言学 数据概述: 该数据集包含英语到印地语的平行语料,记录了成对的英语原文和对应的印地语翻译。主要特征如下:...
    packageimg
  • 阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb

    2025年5月29日   

    阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-fadyadeeb 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 社交媒体, 语言学, 情感分析, 语料库 数据概述:...
    packageimg
  • 语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley

    2025年5月28日   

    语言文字文本对比研究数据集LanguageTextComparisonCorpus-ayushmuley 数据来源:互联网公开数据 标签:语言学, 文本分析, 文本对比, 语料库, 罗马字母, 梵文, 文本挖掘, 机器学习 数据概述: 该数据集包含来自语言学研究领域的数据,记录了罗马字母转写梵文的文本。主要特征如下:...
    packageimg
  • 翻译质量评估数据集QuACE数据集-emam2002

    2025年5月28日   

    翻译质量评估数据集QuACE数据集-emam2002 数据来源:互联网公开数据 标签:机器翻译,数据集,翻译质量评估,自然语言处理,文本分析,语言学,深度学习,文本相似度 数据概述: 该数据集包含来自 QuACE(Quality Assessment of Computer-Enhanced...
    packageimg
  • 语音合成训练数据集TTSTrainingDataset-ayushs9020

    2025年5月28日   

    语音合成训练数据集TTSTrainingDataset-ayushs9020 数据来源:互联网公开数据 标签:语音合成,数据集,机器学习,自然语言处理,人工智能,语言学,语音识别,文本转语音 数据概述:该数据集包含来自多个来源的语音合成训练数据,记录了文本与相应语音的对应关系,用于训练语音合成模型。主要特征如下:...
    packageimg
  • 英语到印地语翻译数据集-amnydv17

    2025年5月28日   

    英语到印地语翻译数据集-amnydv17 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言学,英语,印地语,文本翻译,深度学习 数据概述: 该数据集包含了大量的英语到印地语的翻译文本对,旨在用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据集的构建时间跨度不固定,持续更新和扩展。...
    packageimg