找到590个数据集

标签: 语言学研究

过滤结果
  • 印地语-英语混合语言数据集-saahir2629

    2025年4月25日   

    印地语-英语混合语言数据集-saahir2629 数据来源:互联网公开数据 标签:印地语,英语,混合语言,数据集,自然语言处理,文本分析,机器翻译,语言学 数据概述:该数据集包含印地语和英语混合语言的文本数据,记录了两种语言混合使用的各种场景。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了现代社交媒体和日常交流中的常见用例。...
    packageimg
  • 语音识别数据集英国和墨西哥英语音频2020-2022数据集SpeechRecognitionDatasetEnglandandMexico-birdy654

    2025年4月25日   

    语音识别数据集英国和墨西哥英语音频2020-2022数据集SpeechRecognitionDatasetEnglandandMexico-birdy654 数据来源:互联网公开数据 标签:语音识别,数据集,英语音频,机器学习,自然语言处理,语音转文本,语言学研究,跨文化研究...
    packageimg
  • 阿拉伯圣训数据集

    2025年4月25日   

    阿拉伯圣训数据集 数据来源: 互联网公开数据 标签: 圣训,阿拉伯,伊斯兰教,宗教文献,经典学说,文本分析,历史研究,语料库 数据概述:...
    packageimg
  • 美国手语数据集AmericanSignLanguageDataset-samuelhalim12

    2025年4月25日   

    美国手语数据集AmericanSignLanguageDataset-samuelhalim12 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,人工智能,图像处理,教育技术,语言学研究,辅助技术 数据概述: 该数据集包含美国手语(ASL)的图像或视频数据,记录了手语字母和数字的表达方式。主要特征如下:...
    packageimg
  • 古兰经沃洛夫语-法语翻译数据集AlxuraanWolof-FrenchDataset-cibfaye

    2025年4月25日   

    古兰经沃洛夫语-法语翻译数据集AlxuraanWolof-FrenchDataset-cibfaye 数据来源:互联网公开数据 标签:古兰经,沃洛夫语,法语,翻译,语言学,自然语言处理,数据集,跨语言 数据概述: 该数据集包含古兰经的沃洛夫语和法语翻译文本,旨在为语言学研究和跨语言文本分析提供资源。主要特征如下: 时间跨度:数据涵盖了古兰经的全部内容。...
    packageimg
  • 阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21

    2025年4月24日   

    阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:...
    packageimg
  • 句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05

    2025年4月24日   

    句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05 数据来源:互联网公开数据 标签:自然语言处理,句法分析,数据集,文本分类,机器学习,语言学研究,人工智能,教育技术 数据概述:...
    packageimg
  • 泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius

    2025年4月24日   

    泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius 数据来源:互联网公开数据 标签:泰米尔语,新闻标题,翻译,数据集,自然语言处理,机器翻译,语言学,媒体分析 数据概述:该数据集包含来自多个来源的泰米尔语新闻标题及其英文翻译,适用于自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 汉字训读数据集KanbunData-kitashinwtf

    2025年4月24日   

    汉字训读数据集KanbunData-kitashinwtf 数据来源:互联网公开数据 标签:汉字,训读,数据集,文字处理,语言学研究,机器学习,文化教育,古籍整理 数据概述: 该数据集包含来自历史文献和古籍的汉字训读数据,记录了传统汉字的读音和注音信息。主要特征如下: 时间跨度:数据记录的时间范围从古代到近代,具体从【起始年份】到【结束年份】。...
    packageimg
  • 圣经多语言阿拉伯语-法语数据集-oumarbenlol

    2025年4月24日   

    圣经多语言阿拉伯语-法语数据集-oumarbenlol 数据来源:互联网公开数据 标签:圣经,多语言,阿拉伯语,法语,文本数据,自然语言处理,语言学,翻译 数据概述: 该数据集包含圣经的阿拉伯语和法语翻译版本,旨在支持跨语言研究和文本分析。主要特征如下: 时间跨度:数据涵盖了圣经的完整文本,版本内容依据发布时间而定。...
    packageimg
  • 豪萨语语料库数据集HausaCorporaDataset-isadutse

    2025年4月24日   

    豪萨语语料库数据集HausaCorporaDataset-isadutse 数据来源:互联网公开数据 标签:豪萨语,语料库,语言学,自然语言处理,机器翻译,数据集,学术研究,文化研究 数据概述:该数据集包含来自多种来源的豪萨语语料,记录了豪萨语的文本数据,适用于语言学研究,自然语言处理和机器翻译等任务。主要特征如下:...
    packageimg
  • 拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot

    2025年4月24日   

    拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,数据集,文本分割,语言处理,数据挖掘,历史文献,自然语言处理,语言学研究 数据概述: 该数据集包含拉丁语的文本分割数据,记录了拉丁语文本的分割和标注信息。主要特征如下:...
    packageimg
  • 越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang

    2025年4月23日   

    越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang 数据来源:互联网公开数据 标签:越南语,拼写错误,数据集,自然语言处理,机器学习,语言学研究,文本分析,错误检测 数据概述: 该数据集包含越南语中的拼写错误数据,记录了越南语文本中的错误拼写及其正确形式。主要特征如下:...
    packageimg
  • 印地文-英文双语数据集Hinglish-EnglishDataset-arpcode

    2025年4月23日   

    印地文-英文双语数据集Hinglish-EnglishDataset-arpcode 数据来源:互联网公开数据 标签:双语数据集,语言学,自然语言处理,机器翻译,文本分析,数据集,印度语言,国际交流 数据概述:该数据集包含来自多个来源的印地文-英文双语数据,主要用于研究和开发印地文与英文之间的翻译和文本分析。主要特征如下:...
    packageimg
  • 越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx

    2025年4月22日   

    越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:...
    packageimg
  • 世界各国国歌歌词与旗帜数据集合集-wricheekadhikari

    2025年4月22日   

    世界各国国歌歌词与旗帜数据集合集-wricheekadhikari 数据来源:互联网公开数据 标签:国歌,歌词,音乐,文化,国家,旗帜,YouTube,视听,多语言 数据概述:...
    packageimg
  • 达里贾-英-阿拉伯语语言学数据集1963-2021-aminemontasir

    2025年4月22日   

    达里贾-英-阿拉伯语语言学数据集1963-2021-aminemontasir 数据来源:互联网公开数据 标签:达里贾,阿拉伯语,英语,翻译,语言学,语法,动词变位,冠词确定,复数形式 数据概述:...
    packageimg
  • TED演讲内容转录数据集

    2025年4月21日   

    TED演讲内容转录数据集 数据来源:互联网公开数据 标签:TED演讲,演讲内容,文本分析,时间序列,语言学研究,公众演讲,数据分析 数据概述:...
    packageimg
  • 德国300万句子数据集

    2025年4月19日   

    德国300万句子数据集 数据来源:互联网公开数据 标签:德语,句子,语料库,语言学研究,自然语言处理,文本分析,频率统计 数据概述:...
    packageimg
  • 多语言平行语料库数据集

    2025年4月19日   

    多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-...
    packageimg