-
阿拉伯语机器学习与技术术语对照数据集ArabicMachineLearningandTechnologyTerminology-ahmedhassanibrahim
阿拉伯语机器学习与技术术语对照数据集ArabicMachineLearningandTechnologyTerminology-ahmedhassanibrahim 数据来源:互联网公开数据 标签:阿拉伯语, 机器学习, 人工智能, 技术术语, 术语翻译, 自然语言处理, 语言学, 术语对照 数据概述:... -
泰米尔语仇恨言论检测数据集TamilHateSpeechDetection-malligasenthil
泰米尔语仇恨言论检测数据集TamilHateSpeechDetection-malligasenthil 数据来源:互联网公开数据 标签:仇恨言论, 泰米尔语, 文本分类, 情感分析, 恶意内容检测, 语言学, 机器学习, 数据标注 数据概述: 该数据集包含来自社交媒体及其他公开渠道的泰米尔语文本,记录了用于识别仇恨言论的文本示例。主要特征如下:... -
波斯语语音识别数据集PersianSpeechRecognitionDataset-melikasaadi
波斯语语音识别数据集PersianSpeechRecognitionDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别, 波斯语, 语音数据, 声学模型, 语言学, 深度学习, 语音转录, 语音合成 数据概述: 该数据集包含波斯语语音数据及其对应的文本转录,旨在用于语音识别模型的训练和评估。主要特征如下:... -
阿拉伯语情感分析文本数据集ArabicSentimentAnalysisTextDataset-colabdscience
阿拉伯语情感分析文本数据集ArabicSentimentAnalysisTextDataset-colabdscience 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 自然语言处理, 情感标注, 机器学习, 语料库, 语言学 数据概述:... -
印地语语音转录数据集HindiSpeechTranscriptionDataset-sarty077
印地语语音转录数据集HindiSpeechTranscriptionDataset-sarty077 数据来源:互联网公开数据 标签:语音识别, 语音转录, 印地语, 文本数据, 声学模型, 自然语言处理, 语言学, 语音合成 数据概述: 该数据集包含印地语语音文件及其对应的文本转录。主要特征如下:... -
西班牙语文本元音辅音分类数据集SpanishTextVowelConsonantClassification-asunmayoral
西班牙语文本元音辅音分类数据集SpanishTextVowelConsonantClassification-asunmayoral 数据来源:互联网公开数据 标签:文本分类, 西班牙语, 语言学, 元音, 辅音, 自然语言处理, 字符识别, 数据标注 数据概述: 该数据集包含西班牙语文本字符数据,记录了字符的元音或辅音属性。主要特征如下:... -
希腊语新约圣经文本数据集NewTestamentGreekTextDataset-nikosraftogiannis
希腊语新约圣经文本数据集NewTestamentGreekTextDataset-nikosraftogiannis 数据来源:互联网公开数据 标签:圣经, 希腊语, 文本分析, 语言学, 语料库, 宗教, 文本挖掘, 古希腊语 数据概述: 该数据集包含来自希腊语新约圣经的文本数据,记录了新约圣经各书卷的希腊语原文。主要特征如下:... -
英语语音文本情感分析数据集EnglishSpeechTextSentimentAnalysis-nikhil9999
英语语音文本情感分析数据集EnglishSpeechTextSentimentAnalysis-nikhil9999 数据来源:互联网公开数据 标签:语音识别, 情感分析, 文本分析, 语音数据, 语言学, 机器学习, 标注数据, 自然语言处理 数据概述: 该数据集包含来自Common... -
西班牙语语音转录数据集SpanishSpeechTranscriptionDataset-raaad3000
西班牙语语音转录数据集SpanishSpeechTranscriptionDataset-raaad3000 数据来源:互联网公开数据 标签:语音识别, 西班牙语, 语音转录, 语言学, 声学模型, 文本分析, 语音数据, 机器学习 数据概述: 该数据集包含来自公开渠道的西班牙语语音数据,记录了语音文件与其对应的文本转录。主要特征如下:... -
文学作品句子语料数据集LiterarySentenceCorpus-harshm27
文学作品句子语料数据集LiterarySentenceCorpus-harshm27 数据来源:互联网公开数据 标签:文学, 句子, 语料库, 文本分析, 自然语言处理, 文本挖掘, 情感分析, 语言学 数据概述: 该数据集包含来自古腾堡计划(Project Gutenberg)电子书的句子数据,记录了文学作品中的句子片段。主要特征如下:... -
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57
孟加拉语词形还原数据集BengaliLemmaDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 语言学, 文本分析, 词干提取, 词汇分析, 语料库 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,记录了孟加拉语单词的词形与其对应的词元(lemma)之间的映射关系。主要特征如下:... -
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma
俄语翻译平行语料数据集Russian-EnglishParallelCorpus-etosyoma 数据来源:互联网公开数据 标签:机器翻译, 俄语, 英语, 语料库, 文本对齐, 自然语言处理, 语言学, 数据集 数据概述: 该数据集包含俄语与英语的平行文本,记录了俄语原文及其对应的英语译文。主要特征如下:... -
印尼多语言平行语料库-爪哇语-巽他语和马来语文本数据集IndonesianMultilingualParallelCorpus-Javanese-Sund...
印尼多语言平行语料库-爪哇语-巽他语和马来语文本数据集IndonesianMultilingualParallelCorpus-Javanese-Sundanese-andMalayTextDataset-alfaariizii 数据来源:互联网公开数据 标签:平行语料库, 机器翻译, 语言学, 爪哇语, 巽他语, 马来语, 文本数据, 自然语言处理... -
英语词频统计分析数据集EnglishWordFrequencyAnalysis-ivancanepa
英语词频统计分析数据集EnglishWordFrequencyAnalysis-ivancanepa 数据来源:互联网公开数据 标签:词频统计, 英语, 文本分析, 自然语言处理, 词性标注, 语料库, 语言学, 数据挖掘 数据概述: 该数据集包含来自公开语料库的英语单词及其出现频率信息,旨在为语言学研究和自然语言处理任务提供基础数据。主要特征如下:... -
泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-mahathibodela
泰卢固语词性标注数据集TeluguPart-of-SpeechTaggingDataset-mahathibodela 数据来源:互联网公开数据 标签:词性标注, 泰卢固语, 自然语言处理, 语言学, 文本分析, 语料库, 机器学习, 标注数据 数据概述: 该数据集包含泰卢固语文本的词性标注数据,记录了泰卢固语单词及其对应的词性标签。主要特征如下:... -
阿拉伯语-英语翻译挑战数据集Arabic-EnglishTranslationChallengeDataset-mohamedabderraouf
阿拉伯语-英语翻译挑战数据集Arabic-EnglishTranslationChallengeDataset-mohamedabderraouf 数据来源:互联网公开数据 标签:机器翻译, 语言学, 阿拉伯语, 英语, 文本翻译, 数据集, 自然语言处理, 语言对 数据概述: 该数据集包含来自多个领域的阿拉伯语-... -
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-saanvi4nair
马拉雅拉姆语语音转录数据集MalayalamSpeechTranscriptionDataset-saanvi4nair 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 语言学, 马拉雅拉姆语, 声学模型, 语音标注, 数据集 数据概述: 该数据集包含来自公开来源的马拉雅拉姆语语音数据,并附带相应的转录文本。主要特征如下:... -
恩贡语-法语-英语词汇对照词典数据集Ngouné-French-EnglishVocabularyDataset-peetprogressngoune
恩贡语-法语-英语词汇对照词典数据集Ngouné-French-EnglishVocabularyDataset-peetprogressngoune 数据来源:互联网公开数据 标签:词汇对照, 语言学, 多语言, 恩贡语, 法语, 英语, 词典, 语料库 数据概述: 该数据集包含来自恩贡语-法语-... -
乌克兰语同义词关系数据集UkrainianSynonymsRelationshipDataset-dmytrochaplynskyi
乌克兰语同义词关系数据集UkrainianSynonymsRelationshipDataset-dmytrochaplynskyi 数据来源:互联网公开数据 标签:乌克兰语, 语言学, 同义词, 词汇关系, 自然语言处理, 文本分析, 词义相似度, 语料库 数据概述: 该数据集包含乌克兰语词汇之间的同义词关系。主要特征如下:... -
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-hamsawahed98
阿拉伯语方言文本分类数据集ArabicDialectTextClassificationDataset-hamsawahed98 数据来源:互联网公开数据 标签:阿拉伯语, 方言识别, 文本分类, 自然语言处理, 语言学, 机器学习, 多分类, 语料库 数据概述:...