-
仇恨言论检测印度语数据集HateSpeechDetectionHindiDataset-salmanasrin
仇恨言论检测印度语数据集HateSpeechDetectionHindiDataset-salmanasrin 数据来源:互联网公开数据 标签:仇恨言论, 印度语, 文本分类, 情感分析, 歧视性语言, 机器翻译, 语料库, 文本标注 数据概述: 该数据集包含来自互联网公开数据,记录了印度语(印地语)文本及其对应的仇恨言论标签。主要特征如下:... -
波斯古典诗歌玛斯纳维文本数据集MasnaviPoetryTextDataset-minar61
波斯古典诗歌玛斯纳维文本数据集MasnaviPoetryTextDataset-minar61 数据来源:互联网公开数据 标签:波斯古典诗歌, 文本生成, 诗歌分析, 机器翻译, 自然语言处理, 诗歌创作, 对比分析, 数据清洗 数据概述: 该数据集包含来自波斯古典诗歌《玛斯纳维》的文本数据,记录了诗歌的原文、释义与相关信息。主要特征如下:... -
英法翻译语句对照数据集English-FrenchTranslationSentenceDataset-mansikasahoo2
英法翻译语句对照数据集English-FrenchTranslationSentenceDataset-mansikasahoo2 数据来源:互联网公开数据 标签:机器翻译, 语言学, 英法翻译, 文本数据, 自然语言处理, 语料库, 双语对照, 文本分析 数据概述: 该数据集包含英法双语的句子对照数据,记录了英语语句及其对应的法语翻译。主要特征如下:... -
多语言足球赛事文本翻译数据集MultilingualFootballEventTextTranslation-pavankandru
多语言足球赛事文本翻译数据集MultilingualFootballEventTextTranslation-pavankandru 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 足球, 赛事, 文本生成, 数据增强, 语料库 数据概述:... -
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-parthplc
多语言文本蕴含关系数据集MultilingualTextualEntailmentDataset-parthplc 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 机器翻译, 多语言, 文本匹配, 逻辑推理, 语义分析, 数据集 数据概述: 该数据集包含来自Parthplc的数据,记录了多语言环境下文本蕴含关系的实例。主要特征如下:... -
多语言文本翻译数据集MultilingualTextTranslationDataset-rohankumarsinghhbtu
多语言文本翻译数据集MultilingualTextTranslationDataset-rohankumarsinghhbtu 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 多语言, 英语, 印地语, 文本处理, 自然语言处理, 数据集 数据概述: 该数据集包含多语言文本翻译数据,记录了英语与印地语的文本翻译对。主要特征如下:... -
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie
语音转录文本测试数据集SpeechTranscriptionTextTestDataset-mohamedmotawie 数据来源:互联网公开数据 标签:语音识别, 语音转录, 文本分析, 声学模型, 语言模型, 机器翻译, 数据集, 语音处理 数据概述: 该数据集包含来自公开测试数据的语音转录文本,记录了语音文件与其对应的文本转录内容。主要特征如下:... -
多语言平行文本语义相似度评估数据集MultilingualParallelTextSemanticSimilarityEvaluationDataset-...
多语言平行文本语义相似度评估数据集MultilingualParallelTextSemanticSimilarityEvaluationDataset-hemangkhatri07 数据来源:互联网公开数据 标签:语义相似度, 文本匹配, 多语言, 机器翻译, 文本分析, 印度语, 英语, 文本对齐 数据概述:... -
豪萨语-英语混合文本问答数据集Hausa-EnglishCode-mixedQuestionAnsweringDataset-usmanmusa
豪萨语-英语混合文本问答数据集Hausa-EnglishCode-mixedQuestionAnsweringDataset-usmanmusa 数据来源:互联网公开数据 标签:机器翻译, 文本分类, 语言混合, 豪萨语, 英语, 问答系统, 自然语言处理, 跨语言分析 数据概述: 该数据集包含来自Usman Musa... -
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-ruhinatabasshum
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-ruhinatabasshum 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 多语言, 情感分析, 机器翻译, 数据标注, 语言学, 自然语言处理 数据概述:... -
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing
多语言平行文本翻译数据集MultilingualParallelTextTranslationDataset-rookiejing 数据来源:互联网公开数据 标签:机器翻译, 文本对齐, 多语言, 英语, 阿姆哈拉语, 马拉地语, 泰卢固语, 语料库, 自然语言处理, 语言学 数据概述:... -
多语言情感分析模型预测结果数据集MultilingualSentimentAnalysisModelPredictionResults-muennighoff
多语言情感分析模型预测结果数据集MultilingualSentimentAnalysisModelPredictionResults-muennighoff 数据来源:互联网公开数据 标签:情感分析, 多语言, 文本分类, 模型预测, 机器翻译, 自然语言处理, 评估, 性能分析 数据概述:... -
马拉地语文本转写数据集MarathiTextTransliterationDataset-omkartupe
马拉地语文本转写数据集MarathiTextTransliterationDataset-omkartupe 数据来源:互联网公开数据 标签:文本转写, 语言模型, 马拉地语, 印度语言, 文本处理, 自然语言处理, 机器翻译, 数据集 数据概述:... -
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026
英语-泰米尔语翻译数据集English-TamilTranslationDataset-kamal2026 数据来源:互联网公开数据 标签:机器翻译, 语言学, 泰米尔语, 英语, 文本翻译, 自然语言处理, 双语对照, 语料库 数据概述: 该数据集包含英语与泰米尔语的翻译对照,旨在为机器翻译模型提供训练数据。主要特征如下:... -
印地语-英语-Hinglish三语翻译数据集Hindi-English-HinglishTri-lingualTranslationDataset-sau...
印地语-英语-Hinglish三语翻译数据集Hindi-English-HinglishTri-lingualTranslationDataset-saumyamishra536 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语言学, 印地语, 英语, Hinglish, 多语言, 自然语言处理 数据概述:... -
法律文本改写训练数据集LegalTextRewritingTrainingDataset-wenzhengcai
法律文本改写训练数据集LegalTextRewritingTrainingDataset-wenzhengcai 数据来源:互联网公开数据 标签:法律文本, 文本改写, 自然语言处理, 法律分析, 文本生成, 机器翻译, 数据集构建, 语料库 数据概述: 该数据集包含法律案例的原文文本,以及根据特定提示改写后的文本。主要特征如下:... -
文本语义相似度判断数据集TextSemanticSimilarityJudgement-florianburger3
文本语义相似度判断数据集TextSemanticSimilarityJudgement-florianburger3 数据来源:互联网公开数据 标签:文本匹配, 语义分析, 自然语言处理, 句子对, 相似度, 情感分析, 数据标注, 机器翻译 数据概述: 该数据集包含用于评估文本语义相似度的句子对,记录了句子之间的语义关联程度。主要特征如下:... -
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05
语义文本相似度STS数据集SemanticTextualSimilaritySTSDataset-andrewshao05 数据来源:互联网公开数据 标签:语义相似度, 文本理解, 自然语言处理, 句子对, 情感分析, 机器翻译, 文本匹配, 数据集 数据概述: 该数据集包含来自多个来源的文本对,记录了句子之间的语义相似度信息。主要特征如下:... -
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-xbxbxb123
中文文本情感分析数据集ChineseTextSentimentAnalysisDataset-xbxbxb123 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文NLP, 情感识别, 机器翻译, 数据集, 深度学习, 自然语言处理 数据概述:... -
基尼亚语文本相似度训练数据集KinyarwandaTextSimilarityTrainingData-rookiejing
基尼亚语文本相似度训练数据集KinyarwandaTextSimilarityTrainingData-rookiejing 数据来源:互联网公开数据 标签:文本相似度, 基尼亚语, 自然语言处理, 语料库, 机器翻译, 文本匹配, 情感分析, 数据标注 数据概述: 该数据集包含来自基尼亚语文本的配对数据,记录了文本对之间的相似度评分。主要特征如下:...