找到646个数据集

标签: 文本生成

过滤结果
  • LLM提示恢复数据集800个提示

    2025年4月15日   

    LLM提示恢复数据集800个提示 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,机器学习,竞赛数据,文本生成,人工智能 数据概述: 本数据集为LLM提示恢复竞赛而创建,包含了800个精心设计的语言模型提示。这些提示涵盖了多种应用场景和主题,旨在用于评估和改进语言模型的提示恢复能力。数据集中的每个提示都经过仔细设计,确保多样性和代表性。...
    packageimg
  • 自然语言处理数据增强用反向翻译数据集

    2025年4月15日   

    自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear...
    packageimg
  • LLM科学考试GPT-3-5模型生成答案数据集

    2025年4月15日   

    LLM科学考试GPT-3-5模型生成答案数据集 数据来源:互联网公开数据 标签:LLM,科学考试,GPT-3.5,自然语言处理,考试数据,人工智能,模型输出,文本生成 数据概述: 本数据集包含了GPT-3.5...
    packageimg
  • 越南卫生新闻数据集2023

    2025年4月15日   

    越南卫生新闻数据集2023 数据来源:互联网公开数据 标签:越南新闻,卫生,新闻分类,文本生成,情感分析,假新闻检测 数据概述: 本数据集收录了从2023年越南vnexpress.net网站健康类别中爬取的新闻文章,涵盖新闻的URL、标题、关键词、描述、全文内容、文章长度(字数)和作者信息。数据未经过标准化处理,直接反映了网站的原始数据格式。...
    packageimg
  • 阿拉伯字母文本生成数据集

    2025年4月15日   

    阿拉伯字母文本生成数据集 数据来源:互联网公开数据 标签:阿拉伯字母,文本生成,NLP,内容创作,消息生成,请求响应,多样数据 数据概述:...
    packageimg
  • 保加利亚诗歌数据集1963-2021

    2025年4月15日   

    保加利亚诗歌数据集1963-2021 数据来源:互联网公开数据 标签:保加利亚诗歌,文本生成,作者分类,文学研究,语言学 数据概述: 本数据集收录了从Chitanka.info网站爬取的保加利亚诗歌,涵盖了多个时期的作品。数据以CSV文件格式存储在chitanka-...
    packageimg
  • AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试

    2025年4月14日   

    AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试 数据来源:互联网公开数据 标签:人工智能,文本生成,聊天机器人,自然语言处理,文本检测,机器学习,竞赛数据,ChatGPT,Bard,Bing 数据概述:...
    packageimg
  • LLM恢复对齐数据集

    2025年4月14日   

    LLM恢复对齐数据集 数据来源:互联网公开数据 标签:语言模型,恢复对齐,自然语言处理,NLP,生成模型,对齐评估,文本生成 数据概述 本数据集由Gemma-7b-it模型生成,使用最大token长度设置为256。数据集包含两部分内容:原始文本(document)和重写文本(rewritten)。原始文本来源于Hugging...
    packageimg
  • 大型语言模型训练问答数据集1963-2021

    2025年4月14日   

    大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:...
    packageimg
  • 恐龙星期六情感分析与文本生成研究数据集-2021

    2025年4月14日   

    恐龙星期六情感分析与文本生成研究数据集-2021 数据来源:互联网公开数据 标签:恐龙星期六,Facebook,情感分析,文本生成,自然语言处理,泰国,社交媒体,文本数据 数据概述:...
    packageimg
  • 故事总结数据集

    2025年4月14日   

    故事总结数据集 数据来源:互联网公开数据 标签:故事总结,文本生成,自然语言处理,机器学习,上下文理解,模型训练 数据概述:...
    packageimg
  • ChatGPT-4问答训练数据集-多领域问答场景

    2025年4月14日   

    ChatGPT-4问答训练数据集-多领域问答场景 数据来源:互联网公开数据 标签:ChatGPT, GPT-4, 问答, 语言模型, 训练数据, 自然语言处理, 人工智能, 机器学习, 文本生成 数据概述:...
    packageimg
  • SCP幽默文章数据集

    2025年4月14日   

    SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke...
    packageimg
  • 降世神通-最后的气宗剧本数据集

    2025年4月14日   

    降世神通-最后的气宗剧本数据集 数据来源:互联网公开数据 标签:剧本分析,自然语言处理,机器学习,文本生成,文化研究,角色对话,故事情节 数据概述 本数据集包含了《降世神通:最后的气宗》(Avatar: The Last...
    packageimg
  • 新冠患者临床描述文本生成数据集

    2025年4月14日   

    新冠患者临床描述文本生成数据集 数据来源:互联网公开数据 标签:新冠,患者,临床,描述,文本生成,自然语言处理,医疗,疫情 数据概述: 本数据集包含了从CoronaWhy-Task-TIES项目生成的患者临床描述文本。这些文本由特定的notebook处理生成,旨在为新冠患者提供临床信息。数据集是该notebook最近一次成功运行的输出结果。...
    packageimg
  • 圣训问答对数据集

    2025年4月14日   

    圣训问答对数据集 数据来源:互联网公开数据 标签:圣训,伊斯兰教,问答对,文本生成,宗教研究,机器学习 数据概述...
    packageimg
  • Hinglish印地语-英语混合语机器翻译数据集

    2025年4月14日   

    Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish...
    packageimg
  • 自定义提示数据集

    2025年4月14日   

    自定义提示数据集 数据来源:互联网公开数据 标签:自定义提示,图像到提示,Stable Diffusion,机器学习,竞赛数据,Imagenet,文本生成 数据概述: 本数据集是由我创建的自定义提示生成器函数生成的,用于“Stable Diffusion - Image to Prompts”...
    packageimg
  • 生成模型提示与图像数据集

    2025年4月14日   

    生成模型提示与图像数据集 数据来源:互联网公开数据 标签:生成模型,提示,图像,SD模型,图像生成,文本生成,机器学习 数据概述: 本数据集包含由生成模型(Generative Models)创建的提示(Prompts)与图像(Images),涵盖多种生成任务。所有图像均使用稳定扩散模型(Stable Diffusion,...
    packageimg
  • 自动化记者数据集

    2025年4月14日   

    自动化记者数据集 数据来源:互联网公开数据 标签:自动化记者,文本生成,NLP,新闻摘要,Reddit数据 数据概述: 本数据集来源于正在开发的自动化记者应用程序。数据包括从Reddit获取的对话记录以及由应用程序生成的新闻摘要和新闻内容。该数据集专门用于评估生成文本的质量,适用于自然语言处理(NLP)项目的评估和改进。 数据用途概述:...
    packageimg