-
健康新闻摘要生成数据集HealthNewsSummaryGenerationDataset-gayatriilan
健康新闻摘要生成数据集HealthNewsSummaryGenerationDataset-gayatriilan 数据来源:互联网公开数据 标签:新闻摘要, 文本生成, 循环神经网络, 自然语言处理, 医疗健康, 文本摘要, 机器翻译, 数据挖掘 数据概述:... -
图像描述生成测试数据集ImageCaptioningTestDataset-nourf01
图像描述生成测试数据集ImageCaptioningTestDataset-nourf01 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像标注, 文本生成, 机器翻译, 数据集, 评估 数据概述: 该数据集包含来自Flickr30k和COCO数据集的图像描述样本,用于评估图像描述生成模型的性能。主要特征如下:... -
负面新闻文本情感分析数据集NegativeNewsTextSentimentAnalysisDataset-adevannevessantos
负面新闻文本情感分析数据集NegativeNewsTextSentimentAnalysisDataset-adevannevessantos 数据来源:互联网公开数据 标签:情感分析, 文本分类, 新闻文本, 负面情绪, 自然语言处理, 数据标注, 机器翻译, 多语言 数据概述:... -
人工智能论文摘要分析数据集ArtificialIntelligencePaperAbstractAnalysis-danielmendozac
人工智能论文摘要分析数据集ArtificialIntelligencePaperAbstractAnalysis-danielmendozac 数据来源:互联网公开数据 标签:人工智能, 论文摘要, 文本分析, 自然语言处理, 机器翻译, 深度学习, 计算机视觉, 多模态学习 数据概述:... -
商品俄英翻译文本数据集ProductRussian-EnglishTranslation-kaparna
商品俄英翻译文本数据集ProductRussian-EnglishTranslation-kaparna 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 俄语, 英语, 商品描述, 语言模型, 自然语言处理, 多语言 数据概述:... -
自然语言生成WebNLG训练数据集NaturalLanguageGenerationWebNLGTrainingDataset-rajaatreya
自然语言生成WebNLG训练数据集NaturalLanguageGenerationWebNLGTrainingDataset-rajaatreya 数据来源:互联网公开数据 标签:自然语言生成, 文本生成, 机器翻译, 数据集, 文本摘要, 知识图谱, 对话生成, 语义理解 数据概述:... -
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398
孟加拉语命名实体识别训练数据集BengaliNamedEntityRecognitionTrainingDataset-aman12398 数据来源:互联网公开数据 标签:命名实体识别, 自然语言处理, 孟加拉语, 文本标注, 序列标注, 语言模型, 机器翻译, 文本分析 数据概述:... -
孟加拉语文本数据集BanglaTextDataset-sameen53
孟加拉语文本数据集BanglaTextDataset-sameen53 数据来源:互联网公开数据 标签:孟加拉语, 文本数据, 自然语言处理, 语料库, 文本分析, 语言模型, 情感分析, 机器翻译 数据概述: 该数据集包含来自互联网的孟加拉语文本数据,记录了各种主题的孟加拉语文本片段。主要特征如下: 时间跨度:数据未标明具体时间,可视为静态文本语料。... -
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam
阿拉伯语文本相似度分析数据集ArabicTextSimilarityAnalysis-elemam 数据来源:互联网公开数据 标签:文本相似度, 阿拉伯语, 自然语言处理, 语义分析, 文本匹配, 机器翻译, 语料库, 语言学 数据概述: 该数据集包含阿拉伯语文本对,用于评估和分析文本之间的相似度。主要特征如下:... -
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom
印地语-英语混合语料翻译数据集Hindi-EnglishHinglishTranslationDataset-louistom 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印度语, 英语, 混合语言, 语料库, 自然语言处理, 多语言 数据概述: 该数据集包含来自互联网的印地语-英语混合语料,记录了英语、印地语以及Hinglish(印地语-... -
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1
泰卢固语新闻文本主题分类数据集TeluguNewsTextTopicClassificationDataset-shaikfardeen1 数据来源:互联网公开数据 标签:泰卢固语, 新闻文本, 文本分类, 自然语言处理, 情感分析, 语料库, 机器翻译, 印度 数据概述:... -
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi
英文文本词对齐数据集EnglishTextWordAlignmentDataset-nairsaanvi 数据来源:互联网公开数据 标签:词对齐, 自然语言处理, 文本分析, 语料库, 机器翻译, 文本处理, 数据标注, 语言学 数据概述: 该数据集包含来自不同来源的英文文本数据,记录了词级别的对齐信息,主要用于研究和开发词对齐模型。主要特征如下:... -
文本相似度匹配训练数据集TextSimilarityMatchingTrainingDataset-axiaox
文本相似度匹配训练数据集TextSimilarityMatchingTrainingDataset-axiaox 数据来源:互联网公开数据 标签:文本匹配, 相似度计算, 自然语言处理, 数据集, 文本分类, 机器翻译, 深度学习, 中文 数据概述: 该数据集包含用于训练文本相似度匹配模型的数据,记录了文本对之间的相似性关系。主要特征如下:... -
蒙古语问答对数据集MongolianQuestionAnsweringCorpus-erdeneochir
蒙古语问答对数据集MongolianQuestionAnsweringCorpus-erdeneochir 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 蒙古语, 文本匹配, 语言模型, 数据集构建, 文本分析, 机器翻译 数据概述: 该数据集包含来自互联网的蒙古语问答对,记录了问题及其对应的答案。主要特征如下:... -
阿拉伯语问答数据集ArabicQuestion-AnswerDataset-khaledsayedaaaaa
阿拉伯语问答数据集ArabicQuestion-AnswerDataset-khaledsayedaaaaa 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 语义理解, 语料库, 语言模型 数据概述: 该数据集包含阿拉伯语的问答对,记录了问题及其相应的答案。主要特征如下:... -
越南语餐饮评论情感分析数据集VietnameseRestaurantReviewSentimentAnalysis-tnhokhng
越南语餐饮评论情感分析数据集VietnameseRestaurantReviewSentimentAnalysis-tnhokhng 数据来源:互联网公开数据 标签:情感分析, 文本分类, 越南语, 餐饮评论, 自然语言处理, 数据标注, 机器翻译, 情感极性 数据概述:... -
机器翻译英法平行语料库数据集MachineTranslationEnglish-FrenchParallelCorpus-architjain128
机器翻译英法平行语料库数据集MachineTranslationEnglish-FrenchParallelCorpus-architjain128 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 英法翻译, 语料库, 自然语言处理, 双语对照, 文本对齐, 语言模型 数据概述:... -
孟加拉语语音转录数据集BanglatoIPA-jakir57
孟加拉语语音转录数据集BanglatoIPA-jakir57 数据来源:互联网公开数据 标签:语音识别, 语音转录, 孟加拉语, 国际音标, 语言学, 文本处理, 机器翻译, 语音合成 数据概述: 该数据集包含孟加拉语文本及其对应的国际音标(IPA)转录,旨在支持孟加拉语语音相关的研究与应用。主要特征如下:... -
法国文本摘要生成训练数据集FrenchTextSummarizationTrainingDataset-lahadmbacke
法国文本摘要生成训练数据集FrenchTextSummarizationTrainingDataset-lahadmbacke 数据来源:互联网公开数据 标签:文本摘要, 法语, 自然语言处理, 机器翻译, 文本生成, 深度学习, 语料库, 摘要模型 数据概述: 该数据集包含来自不同来源的法语文本数据,旨在用于训练文本摘要生成模型。主要特征如下:... -
科技文本改写训练数据集TechnologyTextRewritingTrainingDataset-wenzhengcai
科技文本改写训练数据集TechnologyTextRewritingTrainingDataset-wenzhengcai 数据来源:互联网公开数据 标签:文本改写,自然语言处理,机器翻译,科技文本,数据增强,模型训练,Prompt工程,文本生成 数据概述: 该数据集包含来自科技领域的文本,记录了原文、改写提示(rewrite...