-
越南喃字词汇与句子数据集VietnameseNomCharacterVocabularyandSentences-dktahuio
越南喃字词汇与句子数据集VietnameseNomCharacterVocabularyandSentences-dktahuio 数据来源:互联网公开数据 标签:喃字, 越南语, 词汇, 句子, 语言学, 文本分析, 古籍, 历史文献 数据概述:... -
英语词频统计数据集EnglishWordFrequencyStatistics-takashitahara
英语词频统计数据集EnglishWordFrequencyStatistics-takashitahara 数据来源:互联网公开数据 标签:词频统计, 文本分析, 英语, 自然语言处理, 语料库, 语言学, 单词频率, 数据挖掘 数据概述: 该数据集包含来自互联网公开数据的英语单词词频统计信息,记录了大量英语单词及其出现的频率。主要特征如下:... -
Leet文本转换词汇数据集LeetTextConversionVocabularyDataset-joshuajacobs2
Leet文本转换词汇数据集LeetTextConversionVocabularyDataset-joshuajacobs2 数据来源:互联网公开数据 标签:Leet, 文本转换, 词汇, 网络语言, 数据清洗, 自然语言处理, 文本分析, 语言学 数据概述:... -
土耳其语人名识别数据集TurkishPersonNameRecognitionDataset-adnanankaral
土耳其语人名识别数据集TurkishPersonNameRecognitionDataset-adnanankaral 数据来源:互联网公开数据 标签:人名识别,自然语言处理,文本标注,命名实体识别,土耳其语,机器学习,文本分类,语言学 数据概述: 该数据集包含土耳其语人名文本数据,用于训练和评估人名识别模型。主要特征如下:... -
文本语料库搭配与词频分析数据集TextCorpusCollocationandFrequencyAnalysis-esrapolat
文本语料库搭配与词频分析数据集TextCorpusCollocationandFrequencyAnalysis-esrapolat 数据来源:互联网公开数据 标签:文本分析, 语料库, 词频统计, 搭配关系, 自然语言处理, 文本挖掘, 语言学, 词汇学 数据概述:... -
中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123
中英翻译短语句对数据集English-ChineseTranslationSentencePairs-jstar123 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 中文, 英文, 翻译模型, 双语语料库, 自然语言处理 数据概述: 该数据集包含中英双语的短语句对,记录了英文短语及其对应的中文翻译。主要特征如下:... -
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentRelationInferenceDataset-arnab9961
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentRelationInferenceDataset-arnab9961 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 文本匹配, 语篇分析, 机器翻译, 深度学习, 语言学 数据概述:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-akashhalayyanavar
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-akashhalayyanavar 数据来源:互联网公开数据 标签:机器翻译, 语料库, 印地语, 英语, 文本对齐, 语言学, 自然语言处理, 双语数据 数据概述: 该数据集包含印地语和英语的双语平行语料,用于机器翻译模型的训练和评估。主要特征如下:... -
孟加拉谚语语义理解数据集BengaliProverbsSemanticUnderstanding-ghazalismydaughter
孟加拉谚语语义理解数据集BengaliProverbsSemanticUnderstanding-ghazalismydaughter 数据来源:互联网公开数据 标签:谚语, 孟加拉语, 语义分析, 文本理解, 情感分析, 语言学, 数据标注, 自然语言处理 数据概述:... -
印地语语音合成数据集HindiSpeechSynthesisDataset-sarty077
印地语语音合成数据集HindiSpeechSynthesisDataset-sarty077 数据来源:互联网公开数据 标签:语音合成, 文本转语音, 印地语, 音频数据, 语言学, 深度学习, 语音识别, 声学模型 数据概述: 该数据集包含印地语的语音和对应的文本数据,旨在用于语音合成(TTS)模型的训练和评估。主要特征如下:... -
阿富汗普什图语文本情感分析数据集AfghanistanPashtoTextSentimentAnalysis-pashtoaesthetic
阿富汗普什图语文本情感分析数据集AfghanistanPashtoTextSentimentAnalysis-pashtoaesthetic 数据来源:互联网公开数据 标签:情感分析, 普什图语, 文本分类, 语言学, 阿富汗, 机器学习, 自然语言处理, 情感标注 数据概述:... -
印尼谚语隐喻识别数据集IndonesianProverbsFigurativeRecognitionDataset-namazifard
印尼谚语隐喻识别数据集IndonesianProverbsFigurativeRecognitionDataset-namazifard 数据来源:互联网公开数据 标签:谚语, 隐喻, 自然语言处理, 文本分类, 语义理解, 印尼语, 语料库, 语言学 数据概述:... -
斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-rayaneratiarivelo
斯瓦希里语新闻文本分类数据集SwahiliNewsTextClassificationDataset-rayaneratiarivelo 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 斯瓦希里语, 多标签分类, 自然语言处理, 语言学, 机器学习, 语料库 数据概述:... -
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57
孟加拉语词汇词形还原数据集BengaliWordLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 自然语言处理, 孟加拉语, 文本分析, 语言学, 词汇, 语料库, 机器翻译 数据概述: 该数据集包含孟加拉语词汇的词形还原数据,用于训练和评估孟加拉语词形还原模型。主要特征如下:... -
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 矛盾检测, 多语言, 文本分类, 机器翻译, 语言学, 阿拉伯语 数据概述:... -
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi
马达加斯加语词性标注数据集MalagasyPart-of-SpeechTaggingDataset-vatosoarazafi 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 马达加斯加语, 语言学, 文本分析, 语料库, 机器学习, 语言模型 数据概述: 该数据集包含马达加斯加语的词性标注数据,记录了单词及其对应的词性标签。主要特征如下:... -
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57
孟加拉语文本词形还原数据集BanglaTextLemmatizationDataset-jakir57 数据来源:互联网公开数据 标签:词形还原, 孟加拉语, 自然语言处理, 文本分析, 语言学, 文本预处理, 机器翻译, 词干提取 数据概述: 该数据集包含孟加拉语文本的词形还原数据,旨在为孟加拉语文本处理任务提供支持。主要特征如下:... -
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-raulgdp
西班牙语文本词性标注数据集SpanishTextPart-of-SpeechTaggingDataset-raulgdp 数据来源:互联网公开数据 标签:词性标注, 自然语言处理, 西班牙语, 语言学, 文本分析, 语料库, 标注数据, 机器学习 数据概述:... -
孟加拉语仇恨言论文本分类数据集BengaliHateSpeechTextClassificationDataset-asifabdullah
孟加拉语仇恨言论文本分类数据集BengaliHateSpeechTextClassificationDataset-asifabdullah 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 自然语言处理, 孟加拉语, 情感分析, 恶意文本检测, 多标签分类, 语言学 数据概述:... -
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien
摩洛哥口语法语翻译数据集MoroccanDarija-FrenchTranslationDataset-hazelsoufien 数据来源:互联网公开数据 标签:机器翻译, 口语, 语言学, 文本翻译, 摩洛哥, 法语, 对比分析, 语料库 数据概述:...