-
英汉阿拉伯语翻译数据集450-510句对-emam2002
英汉阿拉伯语翻译数据集450-510句对-emam2002 数据来源:互联网公开数据 标签:机器翻译,语言学,数据集,阿拉伯语,英语,翻译,自然语言处理,文本数据 数据概述: 该数据集包含450到510个英汉-阿拉伯语翻译对,旨在促进英汉和阿拉伯语之间的机器翻译研究和开发。主要特征如下: 时间跨度:数据主要集中在当前语言使用情境。... -
产品信息与描述文本数据集ProductInformationandDescriptionTextDataset-alexandrebeiruth
产品信息与描述文本数据集ProductInformationandDescriptionTextDataset-alexandrebeiruth 数据来源:互联网公开数据 标签:产品描述, 文本分析, 产品分类, 市场营销, 自然语言处理, 品牌分析, 机器翻译, 商业智能 数据概述:... -
英法双语翻译词句对照数据集English-FrenchTranslationPairs-bassant12mohamed
英法双语翻译词句对照数据集English-FrenchTranslationPairs-bassant12mohamed 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 文本数据, 自然语言处理, 双语对照, 语料库, 英语, 法语 数据概述: 该数据集包含英法双语的词句对照数据,记录了英语单词或句子及其对应的法语翻译。主要特征如下:... -
数字彼得序列到序列文本生成数据集DigitalPeterSeq2SeqTextGenerationDataset-vitalygladyshev
数字彼得序列到序列文本生成数据集DigitalPeterSeq2SeqTextGenerationDataset-vitalygladyshev 数据来源:互联网公开数据 标签:序列到序列,文本生成,数据集,自然语言处理,深度学习,机器翻译,文本摘要,对话生成 数据概述:... -
多语言社交媒体评论情感分析数据集MultilingualSocialMediaCommentSentimentAnalysisDataset-harveenchadha
多语言社交媒体评论情感分析数据集MultilingualSocialMediaCommentSentimentAnalysisDataset-harveenchadha 数据来源:互联网公开数据 标签:情感分析, 文本分类, 多语言, 社交媒体, 评论, 数据标注, 机器翻译, 自然语言处理 数据概述:... -
多语言视觉问答图像数据集MultilingualVisualQuestionAnsweringImagesDataset-usmanmusa
多语言视觉问答图像数据集MultilingualVisualQuestionAnsweringImagesDataset-usmanmusa 数据来源:互联网公开数据 标签:视觉问答, 多语言, 图像识别, 机器翻译, 自然语言处理, 图像标注, 数据集, 跨模态 数据概述:... -
电影评论情感分析葡萄牙语-英语双语数据集MovieReviewsSentimentAnalysisPortuguese-EnglishBilingualD...
电影评论情感分析葡萄牙语-英语双语数据集MovieReviewsSentimentAnalysisPortuguese-EnglishBilingualDataset-studymart 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 机器翻译, 双语语料库, 电影评论, 葡萄牙语, 英语, 自然语言处理 数据概述:... -
多语言文本蕴含关系推断数据集MultilingualTextualEntailmentDataset-praveshsharma2002
多语言文本蕴含关系推断数据集MultilingualTextualEntailmentDataset-praveshsharma2002 数据来源:互联网公开数据 标签:文本蕴含, 自然语言处理, 机器翻译, 文本匹配, 多语言, 语义分析, 语料库, 深度学习 数据概述:... -
图像文字识别与翻译数据集ImageTextRecognitionandTranslationDataset-sathyavgc
图像文字识别与翻译数据集ImageTextRecognitionandTranslationDataset-sathyavgc 数据来源:互联网公开数据 标签:图像识别, OCR, 机器翻译, 多语言, 文本分析, 深度学习, 计算机视觉, 数据集 数据概述: 该数据集包含图像文件(.jpg,... -
英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh
英法双语翻译短语数据集English-FrenchBilingualTranslationPhrases-nibakh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 双语语料库, 文本数据, 自然语言处理, 翻译模型, 语言对, 语料分析 数据概述: 该数据集包含英法双语短语翻译数据,记录了英语短语及其对应的法语翻译。主要特征如下:... -
越南语10万句数据集-duongtrunghien
越南语10万句数据集-duongtrunghien 数据来源:互联网公开数据 标签:越南语,数据集,自然语言处理,文本分析,机器翻译,语言学,文本语料库,NLP 数据概述: 该数据集包含约10万句越南语文本,涵盖了多种主题和语体。主要特征如下: 时间跨度:数据无明确的时间范围,主要反映现代越南语的使用情况。... -
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi
中文日常语句翻译数据集ChineseDailySentenceTranslationDataset-jahnaviyelamanchi 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 中文, 文本数据, 语料库, 句子翻译, 自然语言处理, 语言模型 数据概述:... -
泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135
泰卢固语文本翻译数据集TeluguTextTranslationDataset-singh94135 数据来源:互联网公开数据 标签:机器翻译, 泰卢固语, 语言学, 文本数据, 自然语言处理, 翻译模型, 双语对照, 数据集 数据概述: 该数据集包含泰卢固语的文本翻译数据,记录了泰卢固语词汇或短语及其对应的翻译。主要特征如下:... -
泰语文本纠错数据集ThaiTextCorrectionDataset-holydark30
泰语文本纠错数据集ThaiTextCorrectionDataset-holydark30 数据来源:互联网公开数据 标签:泰语, 文本纠错, 自然语言处理, 机器翻译, 语言模型, 文本校对, 数据增强, 深度学习 数据概述: 该数据集包含泰语文本的原始文本(src)及其对应的纠正后文本(tgt),主要用于训练和评估泰语文本纠错模型。主要特征如下:... -
英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234
英俄平行语料翻译数据集English-RussianParallelTranslationDataset-user17234 数据来源:互联网公开数据 标签:机器翻译, 语料库, 自然语言处理, 文本对齐, 语言学, 俄语, 英语, 语言模型 数据概述: 该数据集包含来自互联网的英俄平行语料,记录了英语句子及其对应的俄语翻译。主要特征如下:... -
维基百科HowTo文章摘要与正文数据集WikiHowArticleSummaryandText-ibrahimhimida
维基百科HowTo文章摘要与正文数据集WikiHowArticleSummaryandText-ibrahimhimida 数据来源:互联网公开数据 标签:文本摘要, 文本生成, 内容分析, 语言模型, 文本挖掘, 机器翻译, 多语言, 数据集 数据概述:... -
商品评论文本摘要数据集ProductReviewTextSummarization-allenye66
商品评论文本摘要数据集ProductReviewTextSummarization-allenye66 数据来源:互联网公开数据 标签:文本摘要, 情感分析, 商品评论, 自然语言处理, 文本处理, 机器翻译, 数据清洗, 深度学习 数据概述:... -
文本风格转换数据集TextStyleTransferDataset-zaczac
文本风格转换数据集TextStyleTransferDataset-zaczac 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 自然语言处理, 机器翻译, 数据增强, 文本改写, 深度学习, 对比学习 数据概述: 该数据集包含用于文本风格转换任务的数据,主要记录了原始文本及其在不同风格下的改写版本。主要特征如下:... -
法语文本翻译数据集FrenchTextTranslation-aadiwalid
法语文本翻译数据集FrenchTextTranslation-aadiwalid 数据来源:互联网公开数据 标签:机器翻译, 法语, 文本数据, 自然语言处理, 语料库, 语言学, 数据分析, 翻译模型 数据概述: 该数据集包含来自互联网的法语文本片段,主要用于机器翻译模型的训练和评估。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态文本语料。... -
文本重写与指令生成数据集TextRewritingandInstructionGenerationDataset-taikimori
文本重写与指令生成数据集TextRewritingandInstructionGenerationDataset-taikimori 数据来源:互联网公开数据 标签:文本生成, 文本重写, 指令生成, 自然语言处理, 数据增强, 机器翻译, 语料库, 深度学习 数据概述:...