-
英文词汇发音数据集EnglishLexiconPronunciationDataset-nikipshg
英文词汇发音数据集EnglishLexiconPronunciationDataset-nikipshg 数据来源:互联网公开数据 标签:语音学, 词典, 发音, 语音识别, 自然语言处理, 语言学, 音素, 文本分析 数据概述:... -
日本古典文学作品翻译对照数据集JapaneseClassicalLiteratureTranslationDataset-kitashinwtf
日本古典文学作品翻译对照数据集JapaneseClassicalLiteratureTranslationDataset-kitashinwtf 数据来源:互联网公开数据 标签:日语翻译, 古典文学, 万叶集, 伊势物语, 翻译对比, 语言学, 文本分析, 历史文化 数据概述:... -
斯瓦希里语文本情感分析数据集SwahiliLanguageSentimentAnalysisTextData-denismunene
斯瓦希里语文本情感分析数据集SwahiliLanguageSentimentAnalysisTextData-denismunene 数据来源:互联网公开数据 标签:斯瓦希里语, 情感分析, 文本分类, 自然语言处理, 情感词典, 文本数据, 机器学习, 语言学 数据概述:... -
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman 数据来源:互联网公开数据 标签:文本质量, 语言学, 文本相似度, 多语言, 文本处理, 语料库, 数据清洗, 机器学习 数据概述:... -
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui 数据来源:互联网公开数据 标签:机器翻译, 语言学, 中文, 越南语, 翻译对齐, 双语语料库, 自然语言处理, 文本数据 数据概述: 该数据集包含来自互联网的中文与越南语双语对照文本,记录了中文句子及其对应的越南语翻译。主要特征如下:... -
卢旺达语语音转录文本数据集KinyarwandaSpeechTranscriptionTextData-ndayisabae
卢旺达语语音转录文本数据集KinyarwandaSpeechTranscriptionTextData-ndayisabae 数据来源:互联网公开数据 标签:语音识别, 文本转录, 卢旺达语, 语言学, 自然语言处理, 文本数据, 语料库, 语音数据 数据概述:... -
仇恨言论识别英文文本数据集HateSpeechDetectionEnglishTextDataset-shoaibkarnure
仇恨言论识别英文文本数据集HateSpeechDetectionEnglishTextDataset-shoaibkarnure 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 自然语言处理, 情感分析, 社交媒体, 机器学习, 语言学, 语料库 数据概述:... -
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337 数据来源:互联网公开数据 标签:词频统计, 语言学, 语料库, 自然语言处理, 词汇分析, 文本数据, 语言模型, 英语 数据概述:... -
文本可读性评估训练数据集TextReadabilityEvaluationTrainingDataset-vincentwang25
文本可读性评估训练数据集TextReadabilityEvaluationTrainingDataset-vincentwang25 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本特征, 教育, 语言学, 数据集 数据概述:... -
孟加拉语语音质量评估数据集BengaliSpeechQualityAssessment-sushmit0109
孟加拉语语音质量评估数据集BengaliSpeechQualityAssessment-sushmit0109 数据来源:互联网公开数据 标签:语音质量, 孟加拉语, 语音识别, NISQA, 语音评估, 机器学习, 声学分析, 语言学 数据概述: 该数据集包含孟加拉语方言语音数据,并附带了使用NISQA(Non-Intrusive Speech... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-arnab9961
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-arnab9961 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 机器翻译, 语义理解, 多语言, 文本匹配, 语言学, 情感分析 数据概述:... -
社交媒体仇恨言论与情绪分析数据集SocialMediaHateSpeechandSentimentAnalysisDataset-rifqilukmansyah381
社交媒体仇恨言论与情绪分析数据集SocialMediaHateSpeechandSentimentAnalysisDataset-rifqilukmansyah381 数据来源:互联网公开数据 标签:仇恨言论, 情绪分析, 社交媒体, 文本分类, 多标签分类, 情感分析, 语言学, 数据标注 数据概述:... -
阿拉伯语情感分析句子分类数据集ArabicSentimentAnalysisSentenceClassificationDataset-alaablue
阿拉伯语情感分析句子分类数据集ArabicSentimentAnalysisSentenceClassificationDataset-alaablue 数据来源:互联网公开数据 标签:阿拉伯语, 情感分析, 文本分类, 情感标注, 自然语言处理, 语料库, 机器学习, 语言学 数据概述:... -
西班牙语文本对比分析数据集SpanishTextComparisonDataset-agmeque
西班牙语文本对比分析数据集SpanishTextComparisonDataset-agmeque 数据来源:互联网公开数据 标签:文本对比, 西班牙语, 文本相似度, 语义分析, 自然语言处理, 语言学, 机器学习, 数据集构建 数据概述: 该数据集包含西班牙语文本对,记录了文本之间的对比关系,主要用于文本相似度分析、语义理解等任务。主要特征如下:... -
梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary
梵语词汇文本数据集SanskritVocabularyTextDataset-vedanshchaudhary 数据来源:互联网公开数据 标签:梵语, 语言学, 文本分析, 词汇, 文化研究, 古典语言, 文本挖掘, 印度文化 数据概述: 该数据集包含来自互联网的梵语词汇,记录了梵语单词的文本数据。主要特征如下:... -
尼日利亚皮钦语文本数据集NigerianPidginTextDataset-harbidel
尼日利亚皮钦语文本数据集NigerianPidginTextDataset-harbidel 数据来源:互联网公开数据 标签:皮钦语, 文本语料库, 语言学, 自然语言处理, 文本分析, 语言模型, 情感分析, 文本挖掘 数据概述: 该数据集包含来自不同来源的尼日利亚皮钦语文本,记录了各种日常交流和新闻报道的语言实例。主要特征如下:... -
埃及阿拉伯数字组合对照数据集EgyptianArabicNumberCombinations-ahmedhassanibrahim
埃及阿拉伯数字组合对照数据集EgyptianArabicNumberCombinations-ahmedhassanibrahim 数据来源:互联网公开数据 标签:阿拉伯语, 埃及方言, 数字, 语言学习, 文本翻译, 语言学, 数据标注, 文化研究 数据概述:... -
英语-越南语平行语料翻译数据集English-VietnameseParallelCorpusTranslation-khanhxoe
英语-越南语平行语料翻译数据集English-VietnameseParallelCorpusTranslation-khanhxoe 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本翻译, 英语, 越南语, 语料库, 双语对照, 自然语言处理 数据概述:... -
孟加拉语命名实体识别训练与开发数据集BengaliNamedEntityRecognitionTrainingandDevelopmentDataset-...
孟加拉语命名实体识别训练与开发数据集BengaliNamedEntityRecognitionTrainingandDevelopmentDataset-hasanrahim123 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 孟加拉语, 文本标注, 语言学, 机器学习, 文本分析, 语料库 数据概述:... -
阿姆哈拉语及英语词典与翻译数据集AmharicandEnglishDictionaryandTranslationDataset-ferox98
阿姆哈拉语及英语词典与翻译数据集AmharicandEnglishDictionaryandTranslationDataset-ferox98 数据来源:互联网公开数据 标签:阿姆哈拉语, 英语, 词典, 翻译, 语言学, 词汇, 语言学习, 多语言 数据概述:...