找到64个数据集

标签: 语言研究

过滤结果
  • 英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang

    2025年4月25日   

    英语教学语料库数据集CompiledOnestopenglishCorpusDataset-orzhiang 数据来源:互联网公开数据 标签:英语教学,语料库,语言研究,数据集,教育技术,自然语言处理,翻译研究,学术资源 数据概述: 该数据集包含来自Onestopenglish网站的英语教学语料库,记录了英语教学相关的文本内容。主要特征如下:...
    packageimg
  • 英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35

    2025年4月25日   

    英语俚语词典数据集EnglishSlangDictionaryDataset-emreucar35 数据来源:互联网公开数据 标签:语言学,词典,俚语,词汇学,数据集,语言研究,文化研究,教育工具 数据概述: 该数据集包含来自公开资源整理的英语俚语词典数据,记录了英语俚语的词条,释义,使用场景及例句。主要特征如下:...
    packageimg
  • 越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph

    2025年4月25日   

    越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph 数据来源:互联网公开数据 标签:自然语言处理,文本分类,多标签分类,越南语,作文分析,机器学习,教育技术,语言研究 数据概述:...
    packageimg
  • 俄罗斯越南语言数据集RussianVietnameseDataset-flightstar

    2025年4月25日   

    俄罗斯越南语言数据集RussianVietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学,自然语言处理,数据集,机器翻译,跨语言分析,人工智能,语言研究,文本分析 数据概述: 该数据集包含来自互联网公开资源的俄语和越南语语言数据,记录了两种语言的文本句子对,适用于机器翻译,语言学研究等任务。主要特征如下:...
    packageimg
  • 英语与印地语混合语料情感分析数据集HinglishDataforSentimentAnalysis-shivajeetrai

    2025年4月25日   

    英语与印地语混合语料情感分析数据集HinglishDataforSentimentAnalysis-shivajeetrai 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,语言研究,文本分类,多语言处理,数据挖掘 数据概述: 该数据集包含英语与印地语混合(Hinglish)的文本数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 瑞典姓名数据集SvenskaNamnDataset-geeklund

    2025年4月25日   

    瑞典姓名数据集SvenskaNamnDataset-geeklund 数据来源:互联网公开数据 标签:姓名,人口统计,数据集,语言研究,社会学,数据分析,瑞典,文化研究 数据概述:该数据集包含来自瑞典的姓名数据,记录了瑞典人口中的姓名使用情况。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema

    2025年4月25日   

    城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban...
    packageimg
  • 语音口音归档数据集SpeechAccentArchiveModifiedDataset-fotinipap

    2025年4月25日   

    语音口音归档数据集SpeechAccentArchiveModifiedDataset-fotinipap 数据来源:互联网公开数据 标签:语音识别,口音分析,数据集,语言研究,机器学习,发音差异,音素分析,语音学 数据概述: 该数据集包含来自语音口音归档项目(Speech Accent...
    packageimg
  • 网络语言脏话数据集SwearTotalData-parkgarden

    2025年4月25日   

    网络语言脏话数据集SwearTotalData-parkgarden 数据来源:互联网公开数据 标签:网络语言,脏话,文本分析,自然语言处理,数据集,社交媒体,文本挖掘,语言研究 数据概述:该数据集包含来自网络平台和社交媒体的脏话数据,记录了不同用户在各种网络场景下的脏话使用情况。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 方言数据集DialectDataDataset-kitashinwtf

    2025年4月25日   

    方言数据集DialectDataDataset-kitashinwtf 数据来源:互联网公开数据 标签:方言,语言学,数据集,语音识别,机器学习,自然语言处理,语言研究,文化研究 数据概述: 该数据集包含来自不同地区方言的语音和文本数据,记录了多种方言的发音,词汇和语法特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda

    2025年4月25日   

    僧伽罗语新闻数据集SinhalaNewsDataset-virajtharinda 数据来源:互联网公开数据 标签:新闻数据,数据集,文本分析,自然语言处理,机器学习,语言研究,新闻媒体,信息提取 数据概述: 该数据集包含来自僧伽罗语新闻媒体的数据,记录了僧伽罗语新闻文章的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 印度手语数据集IndianSignLanguageDataset-sukhanshudukare

    2025年4月24日   

    印度手语数据集IndianSignLanguageDataset-sukhanshudukare 数据来源:互联网公开数据 标签:印度手语,数据集,手势识别,计算机视觉,图像处理,机器学习,人工智能,语言研究 数据概述: 该数据集包含来自印度手语研究所的公开数据,记录了印度手语的视觉表达和手势动作。主要特征如下:...
    packageimg
  • 有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi

    2025年4月24日   

    有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi 数据来源:互联网公开数据 标签:评论分析,数据集,机器学习,文本分类,自然语言处理,社交媒体,深度学习,语言研究 数据概述: 该数据集包含来自互联网上的用户评论数据,主要用于识别和分类有毒评论。主要特征如下:...
    packageimg
  • 情感色彩俄语词汇词典数据集DictionaryofEmotionallyChargedRussianWordsDataset-luchsmann

    2025年4月24日   

    情感色彩俄语词汇词典数据集DictionaryofEmotionallyChargedRussianWordsDataset-luchsmann 数据来源:互联网公开数据 标签:词汇学,情感分析,俄语,数据集,语言研究,机器学习,情感语言学,自然语言处理 数据概述:...
    packageimg
  • 拉丁语语料库数据集CorpusLatinDataset-nerdofdot

    2025年4月24日   

    拉丁语语料库数据集CorpusLatinDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,语料库,语言研究,古文献,自然语言处理,历史语言学,文本分析,古籍数字化 数据概述: 该数据集包含来自拉丁语文献的语料,记录了拉丁语在不同历史时期的文本内容。主要特征如下:...
    packageimg
  • 德语语法数据集GermanGrammarDataset-upamasarker

    2025年4月24日   

    德语语法数据集GermanGrammarDataset-upamasarker 数据来源:互联网公开数据 标签:语言学,语法分析,数据集,自然语言处理,教育技术,机器学习,德语学习,语言研究 数据概述: 该数据集包含来自德语语法研究项目的数据,记录了德语语法规则和例句的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik

    2025年4月24日   

    俄罗斯文本风格分类数据集RussianTextStyleClassificationDataset-lemkarik 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,风格分析,机器学习,语言研究,情感分析,多语言处理 数据概述: 该数据集包含来自俄罗斯互联网公开来源的文本数据,记录了不同风格和语境下的文本样本。主要特征如下:...
    packageimg
  • 印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi

    2025年4月24日   

    印地语歌曲歌词数据集HindiSongLyricsDataset-devitachi 数据来源:互联网公开数据 标签:印地语,歌曲歌词,数据集,自然语言处理,文本分析,机器学习,音乐学,语言研究 数据概述: 该数据集包含来自印地语流行音乐作品的歌曲歌词数据,记录了印地语歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。...
    packageimg
  • Kaggle写作数据集KaggleWrite-upDataDataset-ehsaasdhand

    2025年4月24日   

    Kaggle写作数据集KaggleWrite-upDataDataset-ehsaasdhand 数据来源:互联网公开数据 标签:文本数据,写作分析,数据集,自然语言处理,机器学习,教育技术,语言研究,数据挖掘 数据概述: 该数据集包含来自Kaggle平台的用户写作数据,记录了用户在平台上提交的写作内容。主要特征如下:...
    packageimg
  • 阿拉伯语文章数据集ArabicArticleDataset-surayhan

    2025年4月24日   

    阿拉伯语文章数据集ArabicArticleDataset-surayhan 数据来源:互联网公开数据 标签:阿拉伯语,文章,数据集,自然语言处理,文本分析,机器学习,语言研究,数据挖掘 数据概述: 该数据集包含来自互联网的阿拉伯语文本,记录了各类阿拉伯语文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg