-
JASPER语音语料库数据集
2025年6月4日 30 140 98
JASPER语音语料库数据集 数据来源:互联网公开数据 标签:语音语料库,日本语速,发音错误识别,母语者,慢速,中速,快速,语音处理,语言学研究 数据概述: 本数据集是JASPER语音语料库(Japanese Speaking Rate... -
圣经多语言平行语料库
2025年5月31日 30 35 29
圣经多语言平行语料库 数据来源:互联网公开数据 标签:多语言,平行语料库,圣经翻译,语言对比,机器翻译,语言学研究,跨文化交流 数据概述: 本数据集是一个多语言平行语料库,由Christos Christodoulopoulos和Mark... -
多语言语音转录数据集
2025年5月31日 30 102 91
多语言语音转录数据集 数据来源:互联网公开数据 标签:多语言,语音识别,说话人识别,语音转录,语言学研究,年龄分布,性别分布,口音分析,社会语言学 数据概述:... -
卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16
2025年5月18日 30 75 54
卡纳达语与英语多语言数据集Kannada-EnglishMulti-lingualDataset-python16 数据来源:互联网公开数据 标签:多语言,卡纳达语,英语,数据集,自然语言处理,机器翻译,语言学研究,文本分析 数据概述: 该数据集包含卡纳达语与英语的多语言文本数据,记录了两种语言之间的文本对齐信息。主要特征如下:... -
世界语言家族地图数据集
2025年4月27日 30 151 99
世界语言家族地图数据集 数据来源:互联网公开数据 标签:语言家族,地理分布,语言学研究,语言多样性,学术资源 数据概述: 本数据集基于Glottolog... -
语音识别数据集英国和墨西哥英语音频2020-2022数据集SpeechRecognitionDatasetEnglandandMexico-birdy654
2025年4月25日 30 97 10
语音识别数据集英国和墨西哥英语音频2020-2022数据集SpeechRecognitionDatasetEnglandandMexico-birdy654 数据来源:互联网公开数据 标签:语音识别,数据集,英语音频,机器学习,自然语言处理,语音转文本,语言学研究,跨文化研究... -
美国手语数据集AmericanSignLanguageDataset-samuelhalim12
2025年4月25日 30 152 2
美国手语数据集AmericanSignLanguageDataset-samuelhalim12 数据来源:互联网公开数据 标签:手语识别,数据集,计算机视觉,人工智能,图像处理,教育技术,语言学研究,辅助技术 数据概述: 该数据集包含美国手语(ASL)的图像或视频数据,记录了手语字母和数字的表达方式。主要特征如下:... -
阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21
2025年4月24日 30 111 41
阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:... -
句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05
2025年4月24日 30 93 48
句子类型分类数据集SentenceTypes-Question-Command-andStatementDataset-brijeshgzp05 数据来源:互联网公开数据 标签:自然语言处理,句法分析,数据集,文本分类,机器学习,语言学研究,人工智能,教育技术 数据概述:... -
汉字训读数据集KanbunData-kitashinwtf
2025年4月24日 30 28 27
汉字训读数据集KanbunData-kitashinwtf 数据来源:互联网公开数据 标签:汉字,训读,数据集,文字处理,语言学研究,机器学习,文化教育,古籍整理 数据概述: 该数据集包含来自历史文献和古籍的汉字训读数据,记录了传统汉字的读音和注音信息。主要特征如下: 时间跨度:数据记录的时间范围从古代到近代,具体从【起始年份】到【结束年份】。... -
拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot
2025年4月24日 30 161 135
拉丁语分割数据数据集LatinSplitDataDataset-nerdofdot 数据来源:互联网公开数据 标签:拉丁语,数据集,文本分割,语言处理,数据挖掘,历史文献,自然语言处理,语言学研究 数据概述: 该数据集包含拉丁语的文本分割数据,记录了拉丁语文本的分割和标注信息。主要特征如下:... -
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang
2025年4月23日 30 24 21
越南语拼写错误数据集VietnameseMisspellDataset-khanglehoang 数据来源:互联网公开数据 标签:越南语,拼写错误,数据集,自然语言处理,机器学习,语言学研究,文本分析,错误检测 数据概述: 该数据集包含越南语中的拼写错误数据,记录了越南语文本中的错误拼写及其正确形式。主要特征如下:... -
越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx
2025年4月22日 30 60 53
越南语词汇与语料数据集Viettat-ThanhnguVietnameseVocabularyandCorpusDataset-duykhnhavx 数据来源:互联网公开数据 标签:语言学研究,越南语,词汇分析,语料库,自然语言处理,文本挖掘,语言技术,数据集 数据概述:... -
TED演讲内容转录数据集
2025年4月21日 30 40 24
TED演讲内容转录数据集 数据来源:互联网公开数据 标签:TED演讲,演讲内容,文本分析,时间序列,语言学研究,公众演讲,数据分析 数据概述:... -
德国300万句子数据集
2025年4月19日 30 96 82
德国300万句子数据集 数据来源:互联网公开数据 标签:德语,句子,语料库,语言学研究,自然语言处理,文本分析,频率统计 数据概述:... -
英语词典数据集
2025年4月18日 30 152 107
英语词典数据集 数据来源:互联网公开数据 标签:英语词汇,词典数据,词性标注,词义解析,语言学研究,文本处理,自然语言处理 数据概述:... -
古典藏文-英文翻译数据集
2025年4月17日 30 73 60
古典藏文-英文翻译数据集 数据来源:互联网公开数据 标签:古典藏文,英文翻译,机器翻译,语料库,语言学研究,MT模型训练 数据概述: 本数据集包含古典藏文句子及其对应的英文翻译,每对数据由古典藏文句子和其英文翻译组成。数据集中的文本来源于Lotsawa... -
-
欧洲歌唱大赛YouTube评论数据集-比利时歌曲2013
2025年4月15日 30 116 67
欧洲歌唱大赛YouTube评论数据集-比利时歌曲2013 数据来源:互联网公开数据 标签:欧洲歌唱大赛,YouTube评论,语言学研究,多语言,用户评论,语言态度,文化分析 数据概述:...