-
LLM提示恢复数据集800个提示
LLM提示恢复数据集800个提示 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,机器学习,竞赛数据,文本生成,人工智能 数据概述: 本数据集为LLM提示恢复竞赛而创建,包含了800个精心设计的语言模型提示。这些提示涵盖了多种应用场景和主题,旨在用于评估和改进语言模型的提示恢复能力。数据集中的每个提示都经过仔细设计,确保多样性和代表性。... -
自然语言处理数据增强用反向翻译数据集
自然语言处理数据增强用反向翻译数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,反向翻译,文本分类,多语言,数据集,机器学习,文本生成 数据概述: 本数据集包含了来自Contradictory, My Dear... -
LLM科学考试GPT-3-5模型生成答案数据集
LLM科学考试GPT-3-5模型生成答案数据集 数据来源:互联网公开数据 标签:LLM,科学考试,GPT-3.5,自然语言处理,考试数据,人工智能,模型输出,文本生成 数据概述: 本数据集包含了GPT-3.5... -
越南卫生新闻数据集2023
越南卫生新闻数据集2023 数据来源:互联网公开数据 标签:越南新闻,卫生,新闻分类,文本生成,情感分析,假新闻检测 数据概述: 本数据集收录了从2023年越南vnexpress.net网站健康类别中爬取的新闻文章,涵盖新闻的URL、标题、关键词、描述、全文内容、文章长度(字数)和作者信息。数据未经过标准化处理,直接反映了网站的原始数据格式。... -
-
保加利亚诗歌数据集1963-2021
保加利亚诗歌数据集1963-2021 数据来源:互联网公开数据 标签:保加利亚诗歌,文本生成,作者分类,文学研究,语言学 数据概述: 本数据集收录了从Chitanka.info网站爬取的保加利亚诗歌,涵盖了多个时期的作品。数据以CSV文件格式存储在chitanka-... -
AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试
AI生成文本检测竞赛数据集-聊天机器人响应文本-训练与测试 数据来源:互联网公开数据 标签:人工智能,文本生成,聊天机器人,自然语言处理,文本检测,机器学习,竞赛数据,ChatGPT,Bard,Bing 数据概述:... -
LLM恢复对齐数据集
LLM恢复对齐数据集 数据来源:互联网公开数据 标签:语言模型,恢复对齐,自然语言处理,NLP,生成模型,对齐评估,文本生成 数据概述 本数据集由Gemma-7b-it模型生成,使用最大token长度设置为256。数据集包含两部分内容:原始文本(document)和重写文本(rewritten)。原始文本来源于Hugging... -
大型语言模型训练问答数据集1963-2021
大型语言模型训练问答数据集1963-2021 数据来源:互联网公开数据 标签:大型语言模型,问答系统,多语言,文本生成,机器学习,训练数据,自然语言处理 数据概述:... -
恐龙星期六情感分析与文本生成研究数据集-2021
恐龙星期六情感分析与文本生成研究数据集-2021 数据来源:互联网公开数据 标签:恐龙星期六,Facebook,情感分析,文本生成,自然语言处理,泰国,社交媒体,文本数据 数据概述:... -
-
ChatGPT-4问答训练数据集-多领域问答场景
ChatGPT-4问答训练数据集-多领域问答场景 数据来源:互联网公开数据 标签:ChatGPT, GPT-4, 问答, 语言模型, 训练数据, 自然语言处理, 人工智能, 机器学习, 文本生成 数据概述:... -
SCP幽默文章数据集
SCP幽默文章数据集 数据来源:互联网公开数据 标签:SCP, 幽默, 娱乐, 人工智能, 文本分类, 文本生成, 数据标注, 自然语言处理 数据概述: 本数据集收录了SCP Wiki中的“幽默文章”(Joke... -
降世神通-最后的气宗剧本数据集
降世神通-最后的气宗剧本数据集 数据来源:互联网公开数据 标签:剧本分析,自然语言处理,机器学习,文本生成,文化研究,角色对话,故事情节 数据概述 本数据集包含了《降世神通:最后的气宗》(Avatar: The Last... -
新冠患者临床描述文本生成数据集
新冠患者临床描述文本生成数据集 数据来源:互联网公开数据 标签:新冠,患者,临床,描述,文本生成,自然语言处理,医疗,疫情 数据概述: 本数据集包含了从CoronaWhy-Task-TIES项目生成的患者临床描述文本。这些文本由特定的notebook处理生成,旨在为新冠患者提供临床信息。数据集是该notebook最近一次成功运行的输出结果。... -
-
Hinglish印地语-英语混合语机器翻译数据集
Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish... -
自定义提示数据集
自定义提示数据集 数据来源:互联网公开数据 标签:自定义提示,图像到提示,Stable Diffusion,机器学习,竞赛数据,Imagenet,文本生成 数据概述: 本数据集是由我创建的自定义提示生成器函数生成的,用于“Stable Diffusion - Image to Prompts”... -
生成模型提示与图像数据集
生成模型提示与图像数据集 数据来源:互联网公开数据 标签:生成模型,提示,图像,SD模型,图像生成,文本生成,机器学习 数据概述: 本数据集包含由生成模型(Generative Models)创建的提示(Prompts)与图像(Images),涵盖多种生成任务。所有图像均使用稳定扩散模型(Stable Diffusion,... -
自动化记者数据集
自动化记者数据集 数据来源:互联网公开数据 标签:自动化记者,文本生成,NLP,新闻摘要,Reddit数据 数据概述: 本数据集来源于正在开发的自动化记者应用程序。数据包括从Reddit获取的对话记录以及由应用程序生成的新闻摘要和新闻内容。该数据集专门用于评估生成文本的质量,适用于自然语言处理(NLP)项目的评估和改进。 数据用途概述:...