找到646个数据集

标签: 文本生成

过滤结果
  • ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01

    2025年4月24日   

    ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,文本生成,语言模型,数据挖掘 数据概述: 该数据集包含来自ChatGPT中文对话生成任务的数据,记录了中文自然语言对话的样本。主要特征如下:...
    packageimg
  • 新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari

    2025年4月24日   

    新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari 数据来源:互联网公开数据 标签:新闻,标题生成,数据集,自然语言处理,文本生成,机器学习,语言模型,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的标题,旨在为新闻标题生成任务提供数据支持。主要特征如下:...
    packageimg
  • API测试用例生成数据集APITestCaseGenerationDataset-jacktorrance

    2025年4月24日   

    API测试用例生成数据集APITestCaseGenerationDataset-jacktorrance 数据来源:互联网公开数据 标签:API测试,测试用例,数据集,自然语言处理,机器学习,软件测试,文本生成,自动化测试 数据概述: 该数据集包含用于API测试用例生成的相关数据,记录了API接口的描述信息及其对应的测试用例。主要特征如下:...
    packageimg
  • AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip

    2025年4月24日   

    AlpacaGPT4中文数据集AlpacaGPT4ChineseDataset-airzip 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,数据集,文本生成,机器学习,人工智能,机器翻译,智能对话 数据概述: 该数据集包含来自 Alpaca GPT4 项目的中文数据,记录了用于训练和优化大型语言模型的高质量文本数据。主要特征如下:...
    packageimg
  • 多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang

    2025年4月24日   

    多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:...
    packageimg
  • 机器翻译与评测数据集WMTDataset-English-FrenchMachineTranslationEvaluationDataset-ramya1235

    2025年4月24日   

    机器翻译与评测数据集WMTDataset-English-FrenchMachineTranslationEvaluationDataset-ramya1235 数据来源:互联网公开数据 标签:机器翻译,数据集,英语,法语,翻译评测,自然语言处理,文本生成,人工智能 数据概述: 该数据集来自WMT(Workshop on Machine...
    packageimg
  • 问答系统隐性评价数据集Answer-HydeDataset-kusnguyen

    2025年4月24日   

    问答系统隐性评价数据集Answer-HydeDataset-kusnguyen 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,信息检索,深度学习,文本生成,评估指标 数据概述: 该数据集由Answer-Hyde项目提供,专注于问答系统的隐性评价和性能评估。主要特征如下: 时间跨度:数据记录的时间范围为最近几年,具体未明确。...
    packageimg
  • 大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933

    2025年4月24日   

    大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933 数据来源:互联网公开数据 标签:自然语言处理,LLM,提示词,数据集,文本生成,人工智能,机器学习,语料库,Prompt 数据概述:...
    packageimg
  • 新闻摘要数据集NewsSummaryDataset-usmannwaheed

    2025年4月24日   

    新闻摘要数据集NewsSummaryDataset-usmannwaheed 数据来源:互联网公开数据 标签:新闻,摘要,数据集,文本分析,自然语言处理,机器学习,信息提取,文本生成 数据概述: 该数据集包含来自互联网的新闻文章及其对应的摘要,记录了新闻内容的关键信息。主要特征如下: 时间跨度:数据记录的时间范围从2013年到2017年。...
    packageimg
  • 问答对数据集Question-AnswerDataset-shadesh

    2025年4月24日   

    问答对数据集Question-AnswerDataset-shadesh 数据来源:互联网公开数据 标签:问答,自然语言处理,数据集,文本生成,信息检索,人工智能,机器学习,知识图谱 数据概述: 该数据集包含大量的问答对,记录了问题和相应的答案。主要特征如下: 时间跨度:数据记录的时间跨度不固定,取决于数据来源,涵盖不同时间段。...
    packageimg
  • Pneuma基准测试数据集-luthfibalaka

    2025年4月24日   

    Pneuma基准测试数据集-luthfibalaka 数据来源:互联网公开数据 标签:Pneuma,基准测试,自然语言处理,机器学习,文本生成,模型评估,文本分析,人工智能 数据概述:该数据集包含Pneuma项目发布的基准测试数据,用于评估自然语言处理模型的性能,特别是在文本生成和文本理解方面。主要特征如下:...
    packageimg
  • 生成式样本数据集OriginalGeneratedSamplesDataset-nourelhwaryy

    2025年4月24日   

    生成式样本数据集OriginalGeneratedSamplesDataset-nourelhwaryy 数据来源:互联网公开数据 标签:生成模型,数据集,图像生成,文本生成,机器学习,人工智能,自然语言处理,计算机视觉 数据概述:...
    packageimg
  • 英特尔神经聊天AI文本数据集IntelNeuralChatAITextDataDataset-iharshmgoyal

    2025年4月24日   

    英特尔神经聊天AI文本数据集IntelNeuralChatAITextDataDataset-iharshmgoyal 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,文本生成,机器学习,语言模型,数据挖掘,文本分析 数据概述: 该数据集由英特尔公司提供,包含用于训练和评估神经聊天AI模型的文本数据。主要特征如下:...
    packageimg
  • 大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin

    2025年4月24日   

    大规模高质量中文基准模型数据集LGQBMModelV2Dataset-pnepapin 数据来源:互联网公开数据 标签:自然语言处理,大规模,中文,基准模型,数据集,文本生成,语言理解,机器学习,人工智能 数据概述: 该数据集是LGQBM(大规模高质量中文基准模型)项目的一部分,旨在支持中文自然语言处理(NLP)模型的训练和评估。主要特征如下:...
    packageimg
  • 基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873

    2025年4月24日   

    基因模型优化与微对话数据集GenezcMiniChat1-5-3B12000-16051Dataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,语言模型,人工智能,文本生成,情感分析 数据概述: 该数据集由基因模型优化项目提供,主要记录了微型聊天机器人在不同对话场景下的交互数据。主要特征如下:...
    packageimg
  • 文本摘要生成训练数据集Summaries-TrainTextSummarizationDataset-samruddhimore

    2025年4月24日   

    文本摘要生成训练数据集Summaries-TrainTextSummarizationDataset-samruddhimore 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,文本生成,深度学习,信息提取,人工智能 数据概述: 该数据集包含了用于训练文本摘要生成模型的文本数据,主要记录了原始文本及其对应的摘要。主要特征如下:...
    packageimg
  • 文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564

    2025年4月24日   

    文本摘要生成数据集Summary-Seq2SeqDataset-ajax0564 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,序列到序列模型,机器学习,文本生成,深度学习,信息提取 数据概述: 该数据集专注于文本摘要生成任务,记录了大量的文本及其对应的摘要。主要特征如下: 时间跨度:数据记录的时间范围从过去几年到近期。...
    packageimg
  • 图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss

    2025年4月24日   

    图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像标注,人工智能,文本生成 数据概述: 该数据集包含图像及其对应的文本描述,旨在促进图像描述生成任务的研究和应用。主要特征如下:...
    packageimg
  • 高质量提示词数据集PolishedPromptsDataset-dmitriyab

    2025年4月24日   

    高质量提示词数据集PolishedPromptsDataset-dmitriyab 数据来源:互联网公开数据 标签:自然语言处理,提示词工程,数据集,机器学习,文本生成,人工智能,语言模型,提示优化 数据概述: 该数据集包含经过精心设计和优化的提示词(prompts),用于自然语言处理任务,特别是大语言模型的文本生成。主要特征如下:...
    packageimg
  • 测试训练上下文大型语言模型数据集-quctngngvng

    2025年4月24日   

    测试训练上下文大型语言模型数据集-quctngngvng 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,文本生成,机器学习,模型训练,语言模型,上下文学习 数据概述: 该数据集包含用于训练和评估大型语言模型(LLM)的文本数据,专注于测试训练(Test-Train)场景下的上下文学习能力。主要特征如下: 时间跨度:...
    packageimg