-
自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala
自然语言理解COLA数据集训练与测试NaturalLanguageUnderstandingCOLADatasetTrainandTest-aryansakhala 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 句法分析, 语言模型, 文本理解, 机器翻译, 语义分析, 训练集 数据概述:... -
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura
尼泊尔语拼写纠错数据集NepaliSpellingCorrectionDataset-amardura 数据来源:互联网公开数据 标签:拼写纠错, 尼泊尔语, 自然语言处理, 文本校对, 语言模型, 错误检测, 数据清洗, 机器翻译 数据概述: 该数据集包含尼泊尔语文本,记录了正确的文本及其对应的错误拼写形式,用于尼泊尔语拼写纠错任务。主要特征如下:... -
高棉语图像文本翻译与目标检测数据集KhmerTextTranslationandObjectDetectionDataset-veysreypich
高棉语图像文本翻译与目标检测数据集KhmerTextTranslationandObjectDetectionDataset-veysreypich 数据来源:互联网公开数据 标签:高棉语, 柬埔寨语, 机器翻译, 目标检测, OCR, 图像识别, 文本标注, 计算机视觉 数据概述:... -
多语言负面情绪文本数据集MultilingualNegativeSentimentTextData-adevannevessantos
多语言负面情绪文本数据集MultilingualNegativeSentimentTextData-adevannevessantos 数据来源:互联网公开数据 标签:情感分析, 负面情绪, 多语言, 文本数据, 自然语言处理, 机器翻译, 情感分类, 巴西葡萄牙语 数据概述:... -
多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013
多语言文本识别数据集MultilingualTextIdentification-iitm21f3001013 数据来源:互联网公开数据 标签:文本识别,多语言,语言分类,自然语言处理,机器翻译,文本分析,语料库,印度语 数据概述: 该数据集包含来自多种印度语言的文本片段,旨在用于语言识别任务。主要特征如下:... -
Java代码翻译质量评估数据集JavaCodeTranslationQualityEvaluationDataset-ranimmhisham
Java代码翻译质量评估数据集JavaCodeTranslationQualityEvaluationDataset-ranimmhisham 数据来源:互联网公开数据 标签:代码翻译, 机器翻译, Java, 文本相似度, 编程语言, 质量评估, 机器学习, 语料分析 数据概述:... -
图像描述生成英语文本数据集ImageCaptioningEnglishTextDataset-zeindea
图像描述生成英语文本数据集ImageCaptioningEnglishTextDataset-zeindea 数据来源:互联网公开数据 标签:图像描述, 文本生成, 计算机视觉, 自然语言处理, 机器翻译, 数据标注, 深度学习, 图像理解 数据概述: 该数据集包含来自互联网的图像描述数据,记录了图像与其对应的英文文本描述。主要特征如下:... -
自然语言处理课程作业代码数据集NaturalLanguageProcessingCourseworkCode-balasrinivishal
自然语言处理课程作业代码数据集NaturalLanguageProcessingCourseworkCode-balasrinivishal 数据来源:互联网公开数据 标签:自然语言处理, 机器翻译, 深度学习, Python, Jupyter Notebook, 课程作业, 代码示例, 神经网络 数据概述:... -
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2
英法双语翻译对照数据集English-FrenchTranslationDataset-mansikasahoo2 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语对照, 文本数据, 自然语言处理, 语料库, 语言模型, 文本翻译 数据概述: 该数据集包含英法双语对照的翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:... -
孟加拉语翻译数据集BanglaTranslationDataset-emammame
孟加拉语翻译数据集BanglaTranslationDataset-emammame 数据来源:互联网公开数据 标签:机器翻译, 孟加拉语, 文本翻译, 自然语言处理, 语言模型, 文本数据, 语料库, 翻译 数据概述: 该数据集包含英语到孟加拉语的翻译文本对,用于机器翻译模型的训练和评估。主要特征如下:... -
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki
文本校对与错误纠正数据集TextProofreadingandErrorCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:文本校对, 错误纠正, 语言模型, 自然语言处理, 文本编辑, 语法纠错, 句子对齐, 机器翻译 数据概述:... -
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTraini...
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTrainingandInferenceDataset-dunglduy 数据来源:互联网公开数据 标签:自然语言处理, Transformer, 文本分类, 情感分析, 机器翻译, 预训练模型, 数据集构建,... -
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0
多语言文档标识符数据集MultilingualDocumentIdentifierDataset-fredriknguyenepfl0 数据来源:互联网公开数据 标签:文档标识, 多语言, 文本数据, 语料库, 语言识别, 数据清洗, 信息检索, 机器翻译 数据概述: 该数据集包含来自不同语言的文档标识符,记录了多种语言文档的唯一编号。主要特征如下:... -
多语言产品组装说明文本数据集MultilingualProductAssemblyInstructionTextDataset-patxhaui
多语言产品组装说明文本数据集MultilingualProductAssemblyInstructionTextDataset-patxhaui 数据来源:互联网公开数据 标签:产品组装, 多语言, 文本翻译, 机器翻译, 文本分类, 质量控制, 工业制造, 数据清洗 数据概述:... -
泰语图片描述数据集ThaiImageCaptioningDataset-spitiwan
泰语图片描述数据集ThaiImageCaptioningDataset-spitiwan 数据来源:互联网公开数据 标签:图像描述, 泰语, 机器翻译, 计算机视觉, 自然语言处理, 文本生成, 多模态学习, 图像识别 数据概述: 该数据集包含来自图像的数据,记录了泰语对图像的描述。主要特征如下:... -
泰卢固语词汇分割与分类训练数据集TeluguWordSegmentationandClassificationTrainingDataset-sriram...
泰卢固语词汇分割与分类训练数据集TeluguWordSegmentationandClassificationTrainingDataset-sriramgugulothu 数据来源:互联网公开数据 标签:泰卢固语, 文本分析, 词汇分割, 语言模型, 自然语言处理, 机器翻译, 文本分类, 数据集 数据概述:... -
文本相似度训练数据集TextSimilarityTrainingDataset-krilin
文本相似度训练数据集TextSimilarityTrainingDataset-krilin 数据来源:互联网公开数据 标签:文本相似度, 机器翻译, 文本匹配, 自然语言处理, 语料库, 文本分析, 语言模型, 相似度评估 数据概述: 该数据集包含来自互联网的文本数据,记录了用于训练文本相似度模型的语料。主要特征如下:... -
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki
英语语法纠错数据集EnglishGrammarCorrectionDataset-austuvarki 数据来源:互联网公开数据 标签:语法纠错, 文本校对, 自然语言处理, 语言模型, 机器翻译, 文本生成, 英语学习, 数据增强 数据概述: 该数据集包含来自公开渠道的英语文本数据,记录了原始英文句子及其对应的语法纠正后的版本。主要特征如下:... -
印度新闻广播印地语语音转录文本数据集IndianNewsBroadcastHindiSpeechTranscriptDataset-pranav51286
印度新闻广播印地语语音转录文本数据集IndianNewsBroadcastHindiSpeechTranscriptDataset-pranav51286 数据来源:互联网公开数据 标签:语音识别, 文本转录, 印地语, 新闻广播, 语言学, 声音数据, 机器翻译, 语料库 数据概述:... -
民事诉讼摘要生成文本数据集CivilLitigationSummaryGenerationTextDataset-mlexploreraaditya
民事诉讼摘要生成文本数据集CivilLitigationSummaryGenerationTextDataset-mlexploreraaditya 数据来源:互联网公开数据 标签:民事诉讼, 文本摘要, 自然语言处理, 摘要生成, 法律文本, 机器翻译, 文本分析, 深度学习 数据概述:...