-
英语西班牙语翻译对照数据集English-SpanishTranslationPairs-nouranader
英语西班牙语翻译对照数据集English-SpanishTranslationPairs-nouranader 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 词汇对照, 文本数据, 西班牙语, 英语, 数据集, 翻译 数据概述:... -
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 数据集, 知识图谱, 语义解析, 机器翻译, 语言模型, 数据增强 数据概述: 该数据集包含来自WebNLG 2022... -
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru
英语-马拉雅拉姆语平行语料库数据集English-MalayalamParallelCorpus-alakaru 数据来源:互联网公开数据 标签:机器翻译, 语料库, 双语对照, 自然语言处理, 语言学, 文本数据, 英语, 马拉雅拉姆语 数据概述: 该数据集包含英语和马拉雅拉姆语的平行文本,用于机器翻译和跨语言分析。主要特征如下:... -
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn
文本改写平行语料库数据集TextParaphraseCorpus-zahraasn 数据来源:互联网公开数据 标签:文本生成, 语义相似度, 句子改写, 自然语言处理, 机器翻译, 数据集构建, 文本多样性, 对比学习 数据概述: 该数据集包含用于文本改写的平行语料库,记录了原始句子及其对应的改写版本。主要特征如下:... -
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich
多语言社交媒体内容分析数据集MultilingualSocialMediaContentAnalysisDataset-zakubovich 数据来源:互联网公开数据 标签:社交媒体, 文本分析, 多语言, 内容分类, 情感分析, 机器翻译, 数据清洗, 语料库 数据概述:... -
多语言文本情感分析数据集MultilingualTextSentimentAnalysisDataset-rookiejing
多语言文本情感分析数据集MultilingualTextSentimentAnalysisDataset-rookiejing 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 机器翻译, 自然语言处理, 情感标注, 文本情感, 数据集 数据概述:... -
用户指令意图理解意图改写数据集UserCommandIntentParaphrasingDataset-panjie23
用户指令意图理解意图改写数据集UserCommandIntentParaphrasingDataset-panjie23 数据来源:互联网公开数据 标签:意图识别, 文本生成, 语义理解, 机器翻译, 数据增强, 自然语言处理, 对话系统, 语料库 数据概述:... -
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar 数据来源:互联网公开数据 标签:俄语翻译, 商品店铺, 文本翻译, 语言模型, 机器翻译, 零售业, 数据清洗, 自然语言处理 数据概述: 该数据集包含来自俄罗斯零售店铺的商品店铺名称的俄语原文及其对应的英文翻译。主要特征如下:... -
产品组装SOP中越双语对照数据集ProductAssemblySOPBilingualDataset-paxhaui
产品组装SOP中越双语对照数据集ProductAssemblySOPBilingualDataset-paxhaui 数据来源:互联网公开数据 标签:产品组装, SOP, 中越对照, 文本翻译, 双语语料库, 质量检测, 制造业, 机器翻译 数据概述:... -
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTraini...
自然语言理解Transformer模型训练与推理数据集NaturalLanguageUnderstandingTransformerModelTrainingandInferenceDataset-daominhkhanh 数据来源:互联网公开数据 标签:自然语言处理, Transformer, 文本分类, 机器翻译, 文本生成, 模型训练,... -
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108
多语言数字转录数据集MultilingualNumberTranscriptionDataset-shubhamprakash108 数据来源:互联网公开数据 标签:多语言, 数字转录, 语音识别, 文本翻译, 语言学, 数据集, 文本处理, 机器翻译 数据概述: 该数据集包含多种语言的数字转录数据,记录了数字与其在不同语言中的对应表达。主要特征如下:... -
文本语义相似度判断数据集TextSemanticSimilarityJudgementDataset-saikoushik123
文本语义相似度判断数据集TextSemanticSimilarityJudgementDataset-saikoushik123 数据来源:互联网公开数据 标签:文本相似度, 语义分析, 自然语言处理, 文本匹配, 数据标注, 机器翻译, 深度学习, 对比分析 数据概述:... -
图像-文本多模态泰国旅游场景数据集Image-TextMultimodalThaiTravelDataset-shinupizza
图像-文本多模态泰国旅游场景数据集Image-TextMultimodalThaiTravelDataset-shinupizza 数据来源:互联网公开数据 标签:图像识别, 文本描述, 多模态, 泰国旅游, 图像标注, 机器翻译, 深度学习, 自然语言处理 数据概述: 该数据集包含来自互联网的泰国旅游场景图像及其对应的泰语描述文本。主要特征如下:... -
多语言商品图像描述数据集MultilingualProductImageDescriptionDataset-kounocchi
多语言商品图像描述数据集MultilingualProductImageDescriptionDataset-kounocchi 数据来源:互联网公开数据 标签:图像描述, 多语言, 商品识别, 文本生成, 机器翻译, 跨模态, 视觉语言, 数据标注 数据概述:... -
俄语评论情感分析数据集RussianReviewsSentimentAnalysisDataset-alpin0s
俄语评论情感分析数据集RussianReviewsSentimentAnalysisDataset-alpin0s 数据来源:互联网公开数据 标签:情感分析, 俄语, 评论, 文本分类, 自然语言处理, 机器翻译, 文本预处理, 深度学习 数据概述:... -
英语-泰卢固语平行语料库数据集English-TeluguParallelCorpus-adityaaluri
英语-泰卢固语平行语料库数据集English-TeluguParallelCorpus-adityaaluri 数据来源:互联网公开数据 标签:机器翻译, 语料库, 语言学, 英语, 泰卢固语, 自然语言处理, 双语对照, 数据集 数据概述:... -
多语言医学问答疾病治疗数据集MultilingualMedicalQuestionAnsweringDiseaseTreatmentDataset-sha...
多语言医学问答疾病治疗数据集MultilingualMedicalQuestionAnsweringDiseaseTreatmentDataset-shashwatnaidu 数据来源:互联网公开数据 标签:医学问答, 多语言, 疾病治疗, 自然语言处理, 机器翻译, 文本分析, 信息检索, 医疗健康 数据概述:... -
越南语-英语翻译语句数据集Vietnamese-EnglishTranslationSentences-khanhxoe
越南语-英语翻译语句数据集Vietnamese-EnglishTranslationSentences-khanhxoe 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 越南语, 英语, 文本数据, 翻译模型, 双语对照, 语料库 数据概述: 该数据集包含来自公共资源的越南语-英语翻译语句对,记录了英语语句及其对应的越南语翻译。主要特征如下:... -
英汉平行语料翻译数据集English-ChineseParallelCorpusTranslation-trid4012
英汉平行语料翻译数据集English-ChineseParallelCorpusTranslation-trid4012 数据来源:互联网公开数据 标签:机器翻译, 语料库, 文本对齐, 双语对照, 语言学, 自然语言处理, 翻译质量评估, 文本分析 数据概述: 该数据集包含英汉双语平行语料,记录了英文句子及其对应的中文翻译。主要特征如下:... -
波斯语蕴含关系文本数据集FarsTailTextualEntailmentDataset-hadibabalou
波斯语蕴含关系文本数据集FarsTailTextualEntailmentDataset-hadibabalou 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 波斯语, 语义推理, 文本分类, 机器翻译, 数据集构建, 语言学 数据概述: 该数据集包含波斯语文本蕴含关系数据,用于训练和评估文本蕴含模型。主要特征如下:...