-
斯瓦希里语语料库数据集-kariukiandrew
斯瓦希里语语料库数据集-kariukiandrew 数据来源:互联网公开数据 标签:斯瓦希里语,语料库,自然语言处理,文本分析,语言学,机器翻译,文本挖掘,非洲语言 数据概述: 该数据集包含斯瓦希里语文本语料,旨在为自然语言处理和语言学研究提供资源。主要特征如下: 时间跨度:数据涵盖不同时期和来源的斯瓦希里语文本。... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495
产品组装SOP中越双语对照数据集ProductAssemblySOPChinese-VietnameseBilingualDataset-phamanhtu495 数据来源:互联网公开数据 标签:双语对照, 机器翻译, 文本翻译, 产品组装, SOP, 越南语, 中文, 制造业 数据概述:... -
法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummarizationandEvaluationDataset-veerchheda11
法律文书摘要生成与评估数据集LegalDocumentAbstractiveSummarizationandEvaluationDataset-veerchheda11 数据来源:互联网公开数据 标签:文本摘要, 法律文书, 自然语言处理, 摘要评估, Rouge指标, 文本生成, 司法案例, 机器翻译 数据概述:... -
多语言平行文本相似度评估数据集MultilingualParallelTextSimilarityEvaluationDataset-rookiejing
多语言平行文本相似度评估数据集MultilingualParallelTextSimilarityEvaluationDataset-rookiejing 数据来源:互联网公开数据 标签:平行语料, 文本相似度, 机器翻译, 多语言, 文本匹配, 西班牙语, 英语, 阿拉伯语, 豪萨语, 机器学习 数据概述:... -
中文新闻摘要生成数据集ChineseNewsSummarizationDataset-spiritwalk
中文新闻摘要生成数据集ChineseNewsSummarizationDataset-spiritwalk 数据来源:互联网公开数据 标签:新闻摘要, 文本生成, 自然语言处理, 机器翻译, 文本摘要, 中文文本, 深度学习, 数据集 数据概述: 该数据集包含来自中国新闻媒体的文章及其对应的摘要,旨在用于训练和评估中文文本摘要模型。主要特征如下:... -
对话摘要生成数据集DialogueSummarizationDataset-moatazsaleh
对话摘要生成数据集DialogueSummarizationDataset-moatazsaleh 数据来源:互联网公开数据 标签:对话摘要, 文本摘要, 自然语言处理, 机器翻译, 文本生成, 对话分析, 数据集, 机器学习 数据概述: 该数据集包含经过预处理的对话文本及其对应的摘要,主要用于训练和评估对话摘要生成模型。主要特征如下:... -
芬兰新闻文章摘要数据集FinnishNewsArticlesSummary-alayagill
芬兰新闻文章摘要数据集FinnishNewsArticlesSummary-alayagill 数据来源:互联网公开数据 标签:新闻摘要, 文本摘要, 自然语言处理, 芬兰语, 文本分析, 语料库, 机器翻译, 信息检索 数据概述:... -
大语言模型生成文本指令微调数据集LargeLanguageModelTextGenerationInstructionFine-tuningDataset...
大语言模型生成文本指令微调数据集LargeLanguageModelTextGenerationInstructionFine-tuningDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:大语言模型, 文本生成, 指令微调, 自然语言处理, 文本分类, 机器翻译, 数据标注, 知识问答 数据概述:... -
印地语文本摘要生成数据集HindiTextSummarizationDataset-syedshaiksha
印地语文本摘要生成数据集HindiTextSummarizationDataset-syedshaiksha 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 印度, 文本生成, 多语言, 摘要模型, 深度学习 数据概述: 该数据集包含来自新闻报道的印地语文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:... -
阿拉伯语语料情感分析标注数据集ArabicCorpusSentimentAnalysisAnnotationDataset-mohamedmakram
阿拉伯语语料情感分析标注数据集ArabicCorpusSentimentAnalysisAnnotationDataset-mohamedmakram 数据来源:互联网公开数据 标签:情感分析, 阿拉伯语, 文本分类, 语料库, 自然语言处理, 情感标注, 词义消歧, 机器翻译 数据概述:... -
自然语言处理问答与指令数据集NaturalLanguageProcessingQuestionAnsweringandInstructionDataset...
自然语言处理问答与指令数据集NaturalLanguageProcessingQuestionAnsweringandInstructionDataset-atharv1610 数据来源:互联网公开数据 标签:自然语言处理, 问答系统, 指令生成, 文本生成, 知识推理, 数据集, 机器翻译, 深度学习 数据概述:... -
问答对重复性判断数据集QuestionPairsDuplicationDetectionDataset-lfmendonca
问答对重复性判断数据集QuestionPairsDuplicationDetectionDataset-lfmendonca 数据来源:互联网公开数据 标签:自然语言处理, 文本相似度, 问答系统, 文本匹配, 深度学习, 机器翻译, 数据集, 二分类 数据概述: 该数据集包含来自问答网站的数据,记录了问题对及其是否为重复问题的判断。主要特征如下:... -
越南电商用户评论情感分析数据集VietnameseE-commerceUserReviewSentimentAnalysis-hoangphuc0611
越南电商用户评论情感分析数据集VietnameseE-commerceUserReviewSentimentAnalysis-hoangphuc0611 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 越南语, 电商, 用户评论, 自然语言处理, 情感分类, 机器翻译 数据概述:... -
多语言医疗问答数据集MultilingualMedicalQuestionAnsweringDataset-allinone123456
多语言医疗问答数据集MultilingualMedicalQuestionAnsweringDataset-allinone123456 数据来源:互联网公开数据 标签:医疗问答, 多语言, 疾病, 药物, 治疗方法, 自然语言处理, 机器翻译, 数据标注 数据概述:... -
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-aryaumesh
印地语-英语翻译数据集Hindi-EnglishTranslationDataset-aryaumesh 数据来源:互联网公开数据 标签:机器翻译, 语言学, 印地语, 英语, 翻译模型, 双语对照, 文本数据, 自然语言处理 数据概述: 该数据集包含来自互联网的英语-印地语翻译对照数据,记录了英语短语或单词及其对应的印地语翻译。主要特征如下:... -
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-jayk00
印地语-英语平行语料翻译数据集Hindi-EnglishParallelCorpus-jayk00 数据来源:互联网公开数据 标签:机器翻译, 文本翻译, 语料库, 印地语, 英语, 自然语言处理, 语言学, 双语数据 数据概述: 该数据集包含来自未知来源的印地语-英语平行语料,记录了印地语文本及其对应的英语翻译。主要特征如下:... -
英法双语翻译语句数据集English-FrenchBilingualTranslationSentences-alihassanml
英法双语翻译语句数据集English-FrenchBilingualTranslationSentences-alihassanml 数据来源:互联网公开数据 标签:机器翻译, 语言学习, 双语语料库, 文本处理, 自然语言处理, 语料分析, 语言模型, 词汇对应 数据概述:... -
印地语词汇翻译数据集HindiVocabularyTranslationDataset-omkartt
印地语词汇翻译数据集HindiVocabularyTranslationDataset-omkartt 数据来源:互联网公开数据 标签:机器翻译, 词汇翻译, 印地语, 文本数据, 自然语言处理, 语言学, 数据集, 词汇对照 数据概述: 该数据集包含来自互联网的印地语词汇及其对应的翻译。主要特征如下:... -
越南语翻译质量评估数据集VietnameseTranslationQualityAssessment-phamanhtu495
越南语翻译质量评估数据集VietnameseTranslationQualityAssessment-phamanhtu495 数据来源:互联网公开数据 标签:机器翻译, 越南语, 文本翻译, 质量评估, 自然语言处理, 语料库, 数据清洗, 多语言 数据概述:...