-
新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik
新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 语料库, 新闻文章, 语义分析 数据概述: 该数据集包含来自 GigaWord...
-
扩散模型与GPT4生成数据集DiffusionDBGPT4GeneratedDataset-jennga
扩散模型与GPT4生成数据集DiffusionDBGPT4GeneratedDataset-jennga 数据来源:互联网公开数据 标签:人工智能,扩散模型,生成数据,自然语言处理,机器学习,数据集,文本生成,深度学习 数据概述: 该数据集包含了由扩散模型与GPT4协同生成的文本数据,记录了不同主题和风格的文本内容。主要特征如下:...
-
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,语言模型,文本生成,智能客服 数据概述: 该数据集包含来自大型语言模型基础对话训练的数据,记录了模型与用户之间的对话交互内容。主要特征如下:...
-
电影剧情文本上下文数据集MoviePlotTextContextDataset-parthplc
电影剧情文本上下文数据集MoviePlotTextContextDataset-parthplc 数据来源:互联网公开数据 标签:电影剧情, 文本上下文, 语料库, 自然语言处理, 文本生成, 情感分析, 文本摘要, 数据集 数据概述: 该数据集包含电影剧情文本及其上下文信息,旨在为自然语言处理任务提供训练和评估数据。主要特征如下:...
-
新模型训练数据集NewModelTrainingDataset-meksuntiphap
新模型训练数据集NewModelTrainingDataset-meksuntiphap 数据来源:互联网公开数据 标签:模型训练,数据集,自然语言处理,文本生成,机器学习,人工智能,数据挖掘,深度学习 数据概述: 该数据集包含用于训练新模型的大量文本数据,涵盖多种主题和风格。主要特征如下:...
-
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:...
-
人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad
人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,数据集,机器学习,文本预处理,语言模型,算法研究 数据概述: 该数据集包含经过预处理的由人工智能生成的文本数据,记录了多种类型和风格的文本内容。主要特征如下:...
-
文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou
文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 提示工程, 自然语言处理, 文本编辑, 语料库, 语言模型, 机器学习 数据概述:...
-
电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer
电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer 数据来源:互联网公开数据 标签:电商,问答生成,自然语言处理,数据集,文本生成,机器学习,信息检索,商品信息 数据概述: 该数据集包含电商平台上的商品信息和对应的问答对,用于训练和评估问答生成模型。主要特征如下:...
-
自然语言处理Prompt生成数据集NaturalLanguageProcessingPromptGeneration-musabumiar2004
自然语言处理Prompt生成数据集NaturalLanguageProcessingPromptGeneration-musabumiar2004 数据来源:互联网公开数据 标签:自然语言处理, Prompt工程, 文本生成, 提示词, 数据增强, 模型训练, 文本分析, 机器学习 数据概述:...
-
乌尔都语GPT对话数据集-laibaasmatullah
乌尔都语GPT对话数据集-laibaasmatullah 数据来源:互联网公开数据 标签:自然语言处理,乌尔都语,对话,GPT,语言模型,文本生成,数据集,人工智能 数据概述:该数据集包含基于GPT模型的乌尔都语对话数据,记录了用户与模型之间的交互内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,持续更新。...
-
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger
CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger 数据来源:互联网公开数据 标签:代码生成,自然语言处理,深度学习,代码理解,软件工程,数据集,编程,文本生成 数据概述: 该数据集包含由CodeBERT模型生成的代码数据,用于代码生成任务。主要特征如下:...
-
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii
人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii 数据来源:互联网公开数据 标签:人工智能, 文本生成, 角色扮演, 语言模型, 文本分析, 数据标注, 机器学习, 自然语言处理 数据概述:...
-
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler
优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler 数据来源:互联网公开数据 标签:自然语言处理,文本生成,机器学习,数据集,语言模型,序列到序列,文本重述,人工智能 数据概述:该数据集包含用于优化下一句生成和同义改写的文本数据,记录了成对的原始句子和优化后的改写句子。主要特征如下:...
-
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif
孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,语言模型,文本分析,机器翻译,文本生成 数据概述: 该数据集包含孟加拉语文本的摘要数据,记录了孟加拉语文章及其对应的摘要信息。主要特征如下:...
-
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban
指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban 数据来源:互联网公开数据 标签:文本生成, 指令微调, 多视角, 数据增强, 自然语言处理, 深度学习, Prompt工程, 数据集构建 数据概述:...
-
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03
GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源:互联网公开数据 标签:自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集 数据概述:...
-
写作质量评估与文本生成数据集WritingQualityAssessmentandTextGenerationDataset-laurensprast
写作质量评估与文本生成数据集WritingQualityAssessmentandTextGenerationDataset-laurensprast 数据来源:互联网公开数据 标签:文本生成, 写作评估, 自然语言处理, 机器学习, 文本分类, 语料分析, 情感分析, 写作技巧 数据概述:...
-
开放助手对话数据集OASST1-SL-valterh
开放助手对话数据集OASST1-SL-valterh 数据来源:互联网公开数据 标签:对话数据,自然语言处理,机器学习,情感分析,文本生成,对话系统,开源,多语言 数据概述: 该数据集包含来自开放助手(Open Assistant)项目的对话数据,主要记录了用户与AI助手的多轮对话内容。主要特征如下:...
-
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064
新闻摘要生成内容数据集NewsSummarizationContentDataset-sandeep16064 数据来源:互联网公开数据 标签:文本摘要, 新闻摘要, 自然语言处理, 文本生成, 机器翻译, 深度学习, 语料库, 摘要模型 数据概述:...



