-
文章提及语言及其ISO代码列表_延续循环
数据集概述 本数据集为单一PDF文件,内容是文章《延续循环》中提及的语言及其对应的ISO代码列表,为语言相关研究或应用提供标准化编码参考。 文件详解 文件名称:The_languages_mentioned_in_the_article_Continuative Cycle_with_thei_ ISO_codes.pdf 文件格式:PDF...
-
闽南语语音词汇及发音数据集
闽南语语音词汇及发音数据集_Min_Nan_Language_Speech_Vocabulary_and_Pronunciation_Dataset 数据来源:互联网公开数据 标签:闽南语,语音识别,语言学,发音,词汇,语音,语料库,声学模型 数据概述:...
-
JASPER语音语料库数据集
JASPER语音语料库数据集 数据来源:互联网公开数据 标签:语音语料库,日本语速,发音错误识别,母语者,慢速,中速,快速,语音处理,语言学研究 数据概述: 本数据集是JASPER语音语料库(Japanese Speaking Rate...
-
青空文庫日文文学语料库数据集
青空文庫日文文学语料库数据集 数据来源:互联网公开数据 标签:日文文学,语料库,文本分析,自然语言处理,教育,文化研究 数据概述: 本数据集是将青空文庫(Aozora Bunko)中收录的日本文学文本编译成更易于使用的CSV格式。包含的经典文学作品涵盖了多个历史时期,为研究日文文本提供了丰富的资源。数据集旨在为研究日文写作和语言学项目提供基础数据支持。...
-
圣经多语言平行语料库
圣经多语言平行语料库 数据来源:互联网公开数据 标签:多语言,平行语料库,圣经翻译,语言对比,机器翻译,语言学研究,跨文化交流 数据概述: 本数据集是一个多语言平行语料库,由Christos Christodoulopoulos和Mark...
-
多语言语音转录数据集
多语言语音转录数据集 数据来源:互联网公开数据 标签:多语言,语音识别,说话人识别,语音转录,语言学研究,年龄分布,性别分布,口音分析,社会语言学 数据概述:...
-
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi
印度英语-阿迪提语料库数据集Hinglish-AditiCorpusDataset-donutkashvi 数据来源:互联网公开数据 标签:印度英语,语料库,自然语言处理,文本分析,语言学,机器学习,文本数据,语言资源 数据概述: 该数据集包含来自阿迪提语料库的印度英语文本数据,记录了印度英语的各种语言现象。主要特征如下:...
-
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo
韩国留学论文翻译数据集TranslatedEssaysKODataset-umgeeyo 数据来源:互联网公开数据 标签:论文翻译,韩国留学,数据集,机器翻译,自然语言处理,语言学,文本分析,韩语 数据概述: 该数据集包含韩国留学申请相关的论文翻译数据,旨在促进机器翻译和语言学习研究。主要特征如下:...
-
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy
越南语-高棉语平行语料数据集Vietnamese-KhmerParallelCorpus-nguyentronghuy 数据来源:互联网公开数据 标签:机器翻译, 语言学, 越南语, 高棉语, 语料库, 平行语料, 文本翻译, 自然语言处理 数据概述: 该数据集包含越南语和高棉语的平行文本,旨在为机器翻译、跨语言研究等任务提供支持。主要特征如下:...
-
卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16
卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16 数据来源:互联网公开数据 标签:多语言,卡纳达语,英语,数据集,自然语言处理,机器翻译,语言学研究,文本分析 数据概述: 该数据集包含卡纳达语与英语的多语言文本数据,记录了两种语言之间的文本对齐信息。主要特征如下:...
-
古兰经注释数据集Quran-TahberDataset-eslamsalah123
古兰经注释数据集Quran-TahberDataset-eslamsalah123 数据来源:互联网公开数据 标签:古兰经,注释,宗教研究,文本分析,文化研究,伊斯兰教,数据集,语言学 数据概述: 该数据集包含来自多种来源的古兰经注释,记录了古兰经各个章节和节文的详细注释内容。主要特征如下:...
-
法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd
法语金额表达数据集FrenchAmountExpressionDataset-sarahhdd 数据来源:互联网公开数据 标签:语言学习,数据集,金额表达,法语,教育技术,自然语言处理,机器学习,语言研究 数据概述: 该数据集包含来自公开语料库的法语金额表达数据,记录了法语中不同金额的书面和口语表达方式。主要特征如下:...
-
斯瓦希里语语料库数据集-kariukiandrew
斯瓦希里语语料库数据集-kariukiandrew 数据来源:互联网公开数据 标签:斯瓦希里语,语料库,自然语言处理,文本分析,语言学,机器翻译,文本挖掘,非洲语言 数据概述: 该数据集包含斯瓦希里语文本语料,旨在为自然语言处理和语言学研究提供资源。主要特征如下: 时间跨度:数据涵盖不同时期和来源的斯瓦希里语文本。...
-
南非北部索托语文本对齐数据集NorthernSothoTextAlignmentDataset-girlyphaladi
南非北部索托语文本对齐数据集NorthernSothoTextAlignmentDataset-girlyphaladi 数据来源:互联网公开数据 标签:文本对齐, 机器翻译, 语言学, 南非语, 语料库, 自然语言处理, 文本分析, 语言资源 数据概述: 该数据集包含来自南非北部索托语的文本对齐数据,记录了不同语句在语料库中的对应关系。主要特征如下:...
-
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 语言对, 曼西语, 俄语, 语料库, 自然语言处理 数据概述: 该数据集包含曼西语和俄语的双语平行文本,旨在为机器翻译、语言研究等领域提供数据支持。主要特征如下:...
-
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien 数据来源:互联网公开数据 标签:机器翻译, 口语, 语言学, 文本翻译, 摩洛哥, 法语, 对比分析, 语料库 数据概述:...
-
世界语言家族地图数据集
世界语言家族地图数据集 数据来源:互联网公开数据 标签:语言家族,地理分布,语言学研究,语言多样性,学术资源 数据概述: 本数据集基于Glottolog...
-
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal
中德小型语料库数据集IDXSSmallEN-DEDataset-drishyaenagpal 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,翻译研究,语言学,文本分析,人工智能,多语言学习 数据概述:该数据集包含来自IDXS项目的小型英语到德语语料库,适用于机器翻译和语言学研究。主要特征如下:...
-
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86
电影字幕数据集Hindi-English2020-2022数据集-manishtripathi86 数据来源:互联网公开数据 标签:电影字幕,数据集,自然语言处理,机器翻译,语言学,多语言数据,文本分析,文化研究 数据概述:...



