数据集 - 海数据

CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223 数据来源：互联网公开数据标签：文本生成，数据集，机器学习，自然语言处理，计算机视觉，多模态学习，图像描述，AI技术...

ZIP

图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar

图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar 数据来源：互联网公开数据标签：图像描述，数据集，计算机视觉，自然语言处理，深度学习，图像标注，人工智能，文本生成数据概述：该数据集包含图像及其对应的文本描述，旨在用于图像描述生成任务。主要特征如下：...

ZIP

提示生成数据集PromptsGeneratedV2Dataset-andreivanenko

提示生成数据集PromptsGeneratedV2Dataset-andreivanenko 数据来源：互联网公开数据标签：自然语言处理，提示生成，数据集，机器学习，文本生成，人工智能，语言模型，数据科学数据概述：该数据集包含来自Prompts Generated V2项目的提示生成数据，记录了用于训练和评估语言模型的提示文本。主要特征如下：...

ZIP

人工智能生成文本竞赛合成数据集-sharathshebbar

人工智能生成文本竞赛合成数据集-sharathshebbar 数据来源：互联网公开数据标签：人工智能，文本生成，数据集，自然语言处理，机器学习，文本分析，竞赛，模型评估数据概述：该数据集包含为人工智能生成文本竞赛（AI-Generated Text...

ZIP

杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh

杰布-普罗姆特配对数据集BART2模型JBPromptPairsDatasetforBART2Model-balrajprajesh 数据来源：互联网公开数据标签：自然语言处理，数据集，文本生成，模型训练，BART，文本匹配，语言模型，人工智能数据概述：该数据集包含杰布·普罗姆特（JB...

ZIP

DAIGT-qwen生成文本数据集-2023-zheyushen

DAIGT-qwen生成文本数据集-2023-zheyushen 数据来源：互联网公开数据标签：DAIGT,qwen,文本生成,数据集,机器学习,深度学习,训练数据,文本处理数据概述：本数据集包含由DAIGT-...

ZIP

端到端自然语言生成餐厅领域挑战数据集-2017-mexwell

端到端自然语言生成餐厅领域挑战数据集-2017-mexwell 数据来源：互联网公开数据标签：自然语言生成,NLG,端到端,数据驱动,餐厅领域,挑战数据集,文本生成数据概述：...

ZIP

人工智能论文摘要风格转换数据集-prathapkashyap

人工智能论文摘要风格转换数据集-prathapkashyap 数据来源：互联网公开数据标签：人工智能,论文摘要,风格转换,自然语言处理,平行语料库,GPT-4,文本生成,风格迁移数据概述：...

ZIP

创意文本生成数据集

标题：创意文本生成数据集数据内容：本数据集包含了三个主要字段，分别是name、prompt和negative_prompt。具体统计信息如下： - name字段包含31种不同的值，表示不同的生成主题或类别。 - prompt字段包含29种不同的值，表示用于生成创意文本的提示信息。 -...

CSV

未来组织科技趋势分析生成文本数据集-2023-gladdenme

未来组织科技趋势分析生成文本数据集-2023-gladdenme 数据来源：互联网公开数据标签：NLP,文本生成,ManaGPT,未来科技,组织变革,人工智能,社会机器人,虚拟现实,增强现实数据概述：...

ZIP

俄罗斯诗歌灵感源泉数据集-19000首诗歌-1900至2023年-grafstor

俄罗斯诗歌灵感源泉数据集-19000首诗歌-1900至2023年-grafstor 数据来源：互联网公开数据标签：俄罗斯诗歌,文学,灵感,文化,语言模型, seq2seq,文本生成数据概述：...

ZIP

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛

2025年4月20日

大规模语言模型生成文本检测数据集-LLM生成文本检测竞赛数据来源：互联网公开数据标签：LLM,文本生成,机器生成文本,自然语言处理,文本检测,人工智能,竞赛数据数据概述：本数据集是为LLM（大型语言模型）生成文本检测竞赛收集的。数据来源于多个公开的文本资源，涵盖了不同来源和类型的文本，旨在用于训练和评估检测模型，以识别由LLM生成的文本。...

ZIP

LLM科学考试数据集-扩展版-带上下文-NUM-SENTENCES-INCLUDE-15

2025年4月20日

LLM科学考试数据集-扩展版-带上下文-NUM-SENTENCES-INCLUDE-15 数据来源：互联网公开数据标签：LLM,科学,考试,数据集,上下文,NLP,文本生成,教育,机器学习数据概述：...

ZIP

HellaSwag常识推理数据集-句子补全任务-通用

2025年4月20日

HellaSwag常识推理数据集-句子补全任务-通用数据来源：互联网公开数据标签：自然语言处理,常识推理,句子补全,NLI,语言理解,文本生成,机器学习,人工智能数据概述：...

ZIP

人民日报新闻数据集

2025年4月19日

人民日报新闻数据集数据来源：互联网公开数据标签：人民日报,新闻数据,文本分析,中文语料,新闻聚类,文本生成,媒体研究数据概述：...

ZIP

多源新闻标题与摘要数据集2023

多源新闻标题与摘要数据集2023 数据来源：互联网公开数据标签：新闻标题,新闻摘要,多源资讯,文本生成,新闻偏见分析,情感分析,媒体研究数据概述：本数据集收录了来自12个精选新闻来源的新闻标题和摘要，数据每日更新并持续增加。数据内容包括新闻来源、作者、标题、描述、新闻原址等关键信息，为新闻研究、文本分析和情感分析提供了丰富的数据资源。...

ZIP

基于知识图谱的故事数据集

基于知识图谱的故事数据集数据来源：互联网公开数据标签：故事生成,知识图谱,自然语言处理,机器学习,推理,上下文理解,文本生成数据概述：本数据集基于知识图谱技术，旨在构建和分析包含丰富语义信息的故事数据。数据集整合了多个项目的研究成果，包括COMET（commonsense transformers for automatic knowledge...

ZIP

大型语言模型训练合成数据-Synthia-v1-3数据集

大型语言模型训练合成数据-Synthia-v1-3数据集数据来源：互联网公开数据标签：大型语言模型,合成数据,训练数据,自然语言处理,文本生成,机器翻译,问答系统,对话生成数据概述：本数据集是专为大型语言模型（LLM）开发和改进而设计的合成训练数据集，主要用于研究和优化migel...

ZIP

艾森民歌数据库MIDI转换与标记化数据集