-
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo
WebNLG2022训练数据文本生成数据集WebNLG2022TrainingDataTextGeneration-thedatadynamo 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 数据集, 知识图谱, 语义解析, 机器翻译, 语言模型, 数据增强 数据概述: 该数据集包含来自WebNLG 2022... -
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209
文本语义匹配数据集TextSemanticMatchingDataset-khuongtran1209 数据来源:互联网公开数据 标签:语义匹配, 文本相似度, 自然语言处理, 文本理解, 对比分析, 数据集, 机器学习, 语言模型 数据概述: 该数据集包含来自不同来源的文本对,记录了句子对之间的语义关系。主要特征如下:... -
西班牙语问答语料库SpanishQuestionAnsweringCorpus-rhythmnarula
西班牙语问答语料库SpanishQuestionAnsweringCorpus-rhythmnarula 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 西班牙语, 文本理解, 语料库, 机器阅读, 语言模型, 数据集 数据概述: 该数据集包含来自公开资料的西班牙语问答对,记录了以西班牙语呈现的上下文信息和对应的提问。主要特征如下:... -
韩语论证文本转述数据集KoreanArgumentationTextParaphrasing-iamyourenergy
韩语论证文本转述数据集KoreanArgumentationTextParaphrasing-iamyourenergy 数据来源:互联网公开数据 标签:文本转述, 自然语言处理, 韩语, 语料库, 文本生成, 深度学习, 数据增强, 语言模型 数据概述: 该数据集包含从韩语论证文本中提取的转述文本对,旨在用于训练和评估文本转述模型。主要特征如下:... -
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar
商品店铺俄语翻译数据集ProductShopRussianTranslationDataset-rickykonwar 数据来源:互联网公开数据 标签:俄语翻译, 商品店铺, 文本翻译, 语言模型, 机器翻译, 零售业, 数据清洗, 自然语言处理 数据概述: 该数据集包含来自俄罗斯零售店铺的商品店铺名称的俄语原文及其对应的英文翻译。主要特征如下:... -
仇恨言论识别与修正语句数据集HateSpeechDetectionandCorrectionSentences-devayani14
仇恨言论识别与修正语句数据集HateSpeechDetectionandCorrectionSentences-devayani14 数据来源:互联网公开数据 标签:仇恨言论, 文本分析, 语句修正, 恶意文本, 自然语言处理, 数据标注, 语言模型, 文本纠错 数据概述:... -
俄语文本问答数据集RussianTextQuestionAnsweringDataset-yuraz28
俄语文本问答数据集RussianTextQuestionAnsweringDataset-yuraz28 数据来源:互联网公开数据 标签:问答系统, 文本理解, 俄语, 自然语言处理, 机器阅读理解, 数据集, 文本分析, 语言模型 数据概述: 该数据集包含俄语文本问答对,旨在用于训练和评估俄语文本的问答系统。主要特征如下:... -
写作评估训练数据集WritingAssessmentTrainingEssays-franknyaboga8
写作评估训练数据集WritingAssessmentTrainingEssays-franknyaboga8 数据来源:互联网公开数据 标签:写作评估, 文本生成, 写作技巧, 语言模型, 文本分析, 创作能力, 机器学习, 语料库 数据概述:... -
英文拼写纠错数据集EnglishSpellingCorrectionDataset-amalsakkoumi
英文拼写纠错数据集EnglishSpellingCorrectionDataset-amalsakkoumi 数据来源:互联网公开数据 标签:拼写纠错, 自然语言处理, 文本校对, 语言模型, 词汇纠正, 机器学习, 英语学习, 文本数据 数据概述:... -
文本生成评估数据集TextGenerationEvaluation-joederosa
文本生成评估数据集TextGenerationEvaluation-joederosa 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 机器翻译, 摘要生成, 文本质量, 数据集, 对比分析, 语言模型 数据概述: 该数据集包含用于评估文本生成模型的数据,记录了原始文本、生成文本及相关评估信息。主要特征如下:... -
儿童英语阅读理解文本可读性分析数据集Children-sEnglishReadingComprehensionTextReadability-siminrao
儿童英语阅读理解文本可读性分析数据集Children-sEnglishReadingComprehensionTextReadability-siminrao 数据来源:互联网公开数据 标签:文本可读性, 儿童教育, 英语学习, 自然语言处理, 语料分析, 文本分析, 语言模型, 阅读理解 数据概述:... -
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-mmuneebiftikhar
乌尔都语新闻摘要数据集UrduNewsSummaryDataset-mmuneebiftikhar 数据来源:互联网公开数据 标签:新闻摘要, 乌尔都语, 文本摘要, 自然语言处理, 语料库, 文本分析, 机器翻译, 语言模型 数据概述:... -
文本数据俄语语料库数据集TextDataRussianCorpus-kartushovdanil
文本数据俄语语料库数据集TextDataRussianCorpus-kartushovdanil 数据来源:互联网公开数据 标签:俄语文本, 语料库, 自然语言处理, 文本分析, 语言模型, 文本挖掘, 语义分析, 文本数据 数据概述: 该数据集包含俄语文本数据,记录了俄语文本的集合,主要用于自然语言处理任务。主要特征如下:... -
西班牙语LLaMA2模型对话语料数据集SpanishLLaMA2DialogueCorpus-rizwanrizwannazir
西班牙语LLaMA2模型对话语料数据集SpanishLLaMA2DialogueCorpus-rizwanrizwannazir 数据来源:互联网公开数据 标签:LLaMA2, 对话数据, 西班牙语, 自然语言处理, 文本生成, 语言模型, 机器翻译, 语料库 数据概述:... -
文本质量评估子任务预测数据集TextQualityAssessmentSubtaskPrediction-kunihikofurugori
文本质量评估子任务预测数据集TextQualityAssessmentSubtaskPrediction-kunihikofurugori 数据来源:互联网公开数据 标签:文本评估, 语言模型, 文本分析, 语法, 连贯性, 词汇, 风格, 机器学习 数据概述:... -
波斯古典诗歌文本生成数据集PersianClassicalPoetryTextGenerationDataset-minar61
波斯古典诗歌文本生成数据集PersianClassicalPoetryTextGenerationDataset-minar61 数据来源:互联网公开数据 标签:诗歌生成,文本生成,波斯语,自然语言处理,机器翻译,语言模型,古典文学,文本对 数据概述: 该数据集包含来自波斯古典诗歌作品的数据,记录了诗歌文本的提问与对应的回答。主要特征如下:... -
孟加拉语数学问题数据集BengaliMathProblemsDataset-aaniksahaa
孟加拉语数学问题数据集BengaliMathProblemsDataset-aaniksahaa 数据来源:互联网公开数据 标签:数学问题, 孟加拉语, 文本分析, 自然语言处理, 数学教育, 数据标注, 机器学习, 语言模型 数据概述: 该数据集包含用孟加拉语编写的数学问题,旨在为数学问题求解和自然语言处理任务提供训练数据。主要特征如下:... -
埃塞俄比亚社交媒体仇恨言论检测数据集EthiopianSocialMediaHateSpeechDetection-tigistwondimneh
埃塞俄比亚社交媒体仇恨言论检测数据集EthiopianSocialMediaHateSpeechDetection-tigistwondimneh 数据来源:互联网公开数据 标签:仇恨言论, 社交媒体, 文本分类, 阿姆哈拉语, 语料库, 情感分析, 自然语言处理, 语言模型 数据概述:... -
多项选择题干扰项生成数据集MultipleChoiceDistractorGeneration-capboy
多项选择题干扰项生成数据集MultipleChoiceDistractorGeneration-capboy 数据来源:互联网公开数据 标签:多项选择题, 干扰项, 文本生成, 教育, 自然语言处理, 考试, 语义分析, 语言模型 数据概述: 该数据集包含用于构建多项选择题干扰项的文本数据,记录了与给定问题相关的错误或不相关的选项。主要特征如下:... -
写作能力评估Prompt提示与文章数据集WritingSkillAssessmentPromptandEssaysDataset-muj76200
写作能力评估Prompt提示与文章数据集WritingSkillAssessmentPromptandEssaysDataset-muj76200 数据来源:互联网公开数据 标签:写作评估, 文本生成, 自然语言处理, 提示工程, 写作技巧, 论文写作, 教育, 语言模型 数据概述:...