-
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill
曼西语-俄语互译文本数据集Mansi-RussianParallelText-abrosimovkirill 数据来源:互联网公开数据 标签:机器翻译, 语言学, 文本数据, 语言对, 曼西语, 俄语, 语料库, 自然语言处理 数据概述: 该数据集包含曼西语和俄语的双语平行文本,旨在为机器翻译、语言研究等领域提供数据支持。主要特征如下:... -
英语文本纠错平行语料数据集EnglishTextCorrectionParallelCorpus-rookiejing
英语文本纠错平行语料数据集EnglishTextCorrectionParallelCorpus-rookiejing 数据来源:互联网公开数据 标签:文本纠错, 机器翻译, 语言学, 自然语言处理, 文本匹配, 语料库, 数据清洗, 英语学习 数据概述:... -
米佐语新闻文本分类数据集MizoNewsTextClassificationDataset-robzchhangte
米佐语新闻文本分类数据集MizoNewsTextClassificationDataset-robzchhangte 数据来源:互联网公开数据 标签:文本分类, 新闻分析, 米佐语, 自然语言处理, 语言学, 机器学习, 情感分析, 语料库 数据概述: 该数据集包含来自互联网的米佐语新闻文章,记录了不同主题的新闻内容,用于文本分类任务。主要特征如下:... -
孟加拉语语音转录地名数据集BengaliSpeechTranscriptionLocationData-jahid24
孟加拉语语音转录地名数据集BengaliSpeechTranscriptionLocationData-jahid24 数据来源:互联网公开数据 标签:语音识别, 孟加拉语, 语音转录, 地理位置, 数据标注, 语音数据, 语言学, 机器学习 数据概述: 该数据集包含来自孟加拉地区的孟加拉语语音转录数据,记录了不同地点的语音转录文本。主要特征如下:... -
南非国家文化与语言技术委员会NCLT斯瓦希里语料库元数据数据集NCLTSwahiliCorpusMetadata-rewardmathebula
南非国家文化与语言技术委员会NCLT斯瓦希里语料库元数据数据集NCLTSwahiliCorpusMetadata-rewardmathebula 数据来源:互联网公开数据 标签:斯瓦希里语, 语料库, 元数据, 语言学, 文本分析, 语言资源, 南非, 自然语言处理 数据概述:... -
约鲁巴语-英语翻译数据集Yoruba-EnglishTranslationDataset-mohamedhelmiklai
约鲁巴语-英语翻译数据集Yoruba-EnglishTranslationDataset-mohamedhelmiklai 数据来源:互联网公开数据 标签:机器翻译, 约鲁巴语, 英语, 语言学, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述:... -
阿萨姆语语音转录数据集AssameseSpeechTranscriptionDataset-hemantasarma
阿萨姆语语音转录数据集AssameseSpeechTranscriptionDataset-hemantasarma 数据来源:互联网公开数据 标签:语音识别, 阿萨姆语, 语音转录, 语言学, 语音合成, 文本分析, 声音数据, 数据标注 数据概述:... -
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib
孟加拉语文本与国际音标对照数据集BengaliTextandIPADataset-mushfiqurrahmangalib 数据来源:互联网公开数据 标签:孟加拉语, 语音学, 语言学, 国际音标, 文本转录, 自然语言处理, 数据集, 语音识别 数据概述:... -
俄语笑话文本数据集RussianJokesTextDataset-mapatb22205
俄语笑话文本数据集RussianJokesTextDataset-mapatb22205 数据来源:互联网公开数据 标签:俄语, 笑话, 文本, 自然语言处理, 语料库, 文本分析, 情感分析, 语言学 数据概述: 该数据集包含来自互联网的俄语笑话文本,记录了各种类型的俄语笑话。主要特征如下: 时间跨度:数据未标明具体时间,视作静态语料数据集使用。... -
英文词汇发音数据集EnglishLexiconPronunciationDataset-nikipshg
英文词汇发音数据集EnglishLexiconPronunciationDataset-nikipshg 数据来源:互联网公开数据 标签:语音学, 词典, 发音, 语音识别, 自然语言处理, 语言学, 音素, 文本分析 数据概述:... -
日本古典文学作品翻译对照数据集JapaneseClassicalLiteratureTranslationDataset-kitashinwtf
日本古典文学作品翻译对照数据集JapaneseClassicalLiteratureTranslationDataset-kitashinwtf 数据来源:互联网公开数据 标签:日语翻译, 古典文学, 万叶集, 伊势物语, 翻译对比, 语言学, 文本分析, 历史文化 数据概述:... -
斯瓦希里语文本情感分析数据集SwahiliLanguageSentimentAnalysisTextData-denismunene
斯瓦希里语文本情感分析数据集SwahiliLanguageSentimentAnalysisTextData-denismunene 数据来源:互联网公开数据 标签:斯瓦希里语, 情感分析, 文本分类, 自然语言处理, 情感词典, 文本数据, 机器学习, 语言学 数据概述:... -
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman
文本质量评估多语言数据集TextQualityAssessmentMultilingualDataset-alvirahman 数据来源:互联网公开数据 标签:文本质量, 语言学, 文本相似度, 多语言, 文本处理, 语料库, 数据清洗, 机器学习 数据概述:... -
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui
中越双语翻译语句数据集Chinese-VietnameseTranslationSentences-patxhaui 数据来源:互联网公开数据 标签:机器翻译, 语言学, 中文, 越南语, 翻译对齐, 双语语料库, 自然语言处理, 文本数据 数据概述: 该数据集包含来自互联网的中文与越南语双语对照文本,记录了中文句子及其对应的越南语翻译。主要特征如下:... -
卢旺达语语音转录文本数据集KinyarwandaSpeechTranscriptionTextData-ndayisabae
卢旺达语语音转录文本数据集KinyarwandaSpeechTranscriptionTextData-ndayisabae 数据来源:互联网公开数据 标签:语音识别, 文本转录, 卢旺达语, 语言学, 自然语言处理, 文本数据, 语料库, 语音数据 数据概述:... -
仇恨言论识别英文文本数据集HateSpeechDetectionEnglishTextDataset-shoaibkarnure
仇恨言论识别英文文本数据集HateSpeechDetectionEnglishTextDataset-shoaibkarnure 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 自然语言处理, 情感分析, 社交媒体, 机器学习, 语言学, 语料库 数据概述:... -
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337
英语词汇频率统计分析数据集EnglishWordFrequencyStatisticsAnalysis-dabber1337 数据来源:互联网公开数据 标签:词频统计, 语言学, 语料库, 自然语言处理, 词汇分析, 文本数据, 语言模型, 英语 数据概述:... -
文本可读性评估训练数据集TextReadabilityEvaluationTrainingDataset-vincentwang25
文本可读性评估训练数据集TextReadabilityEvaluationTrainingDataset-vincentwang25 数据来源:互联网公开数据 标签:文本分析, 可读性评估, 自然语言处理, 机器学习, 文本特征, 教育, 语言学, 数据集 数据概述:... -
孟加拉语语音质量评估数据集BengaliSpeechQualityAssessment-sushmit0109
孟加拉语语音质量评估数据集BengaliSpeechQualityAssessment-sushmit0109 数据来源:互联网公开数据 标签:语音质量, 孟加拉语, 语音识别, NISQA, 语音评估, 机器学习, 声学分析, 语言学 数据概述: 该数据集包含孟加拉语方言语音数据,并附带了使用NISQA(Non-Intrusive Speech... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-arnab9961
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-arnab9961 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 机器翻译, 语义理解, 多语言, 文本匹配, 语言学, 情感分析 数据概述:...