数据集 - 海数据

新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik

2025年5月29日

新闻摘要生成文本数据集NewsSummarizationTextDataset-sebastianpetrik 数据来源：互联网公开数据标签：文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 语料库, 新闻文章, 语义分析数据概述：该数据集包含来自 GigaWord...

ZIP

扩散模型与GPT4生成数据集DiffusionDBGPT4GeneratedDataset-jennga

2025年5月29日

扩散模型与GPT4生成数据集DiffusionDBGPT4GeneratedDataset-jennga 数据来源：互联网公开数据标签：人工智能，扩散模型，生成数据，自然语言处理，机器学习，数据集，文本生成，深度学习数据概述：该数据集包含了由扩散模型与GPT4协同生成的文本数据，记录了不同主题和风格的文本内容。主要特征如下：...

ZIP

大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco

2025年5月29日

大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco 数据来源：互联网公开数据标签：自然语言处理，对话系统，数据集，机器学习，人工智能，语言模型，文本生成，智能客服数据概述：该数据集包含来自大型语言模型基础对话训练的数据，记录了模型与用户之间的对话交互内容。主要特征如下：...

ZIP

电影剧情文本上下文数据集MoviePlotTextContextDataset-parthplc

2025年5月29日

电影剧情文本上下文数据集MoviePlotTextContextDataset-parthplc 数据来源：互联网公开数据标签：电影剧情, 文本上下文, 语料库, 自然语言处理, 文本生成, 情感分析, 文本摘要, 数据集数据概述：该数据集包含电影剧情文本及其上下文信息，旨在为自然语言处理任务提供训练和评估数据。主要特征如下：...

ZIP

新模型训练数据集NewModelTrainingDataset-meksuntiphap

2025年5月29日

新模型训练数据集NewModelTrainingDataset-meksuntiphap 数据来源：互联网公开数据标签：模型训练，数据集，自然语言处理，文本生成，机器学习，人工智能，数据挖掘，深度学习数据概述：该数据集包含用于训练新模型的大量文本数据，涵盖多种主题和风格。主要特征如下：...

ZIP

维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen

2025年5月29日

维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源：互联网公开数据标签：自然语言处理，文本数据，数据集，文本清洗，机器学习，语言模型，信息检索，文本分析数据概述：该数据集是维基文本清洗数据集的第二部分，包含了从维基百科中提取和清洗过的文本数据。主要特征如下：...

ZIP

人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad

2025年5月29日

人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad 数据来源：互联网公开数据标签：人工智能，自然语言处理，文本生成，数据集，机器学习，文本预处理，语言模型，算法研究数据概述：该数据集包含经过预处理的由人工智能生成的文本数据，记录了多种类型和风格的文本内容。主要特征如下：...

ZIP

文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou

2025年5月29日

文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou 数据来源：互联网公开数据标签：文本生成, 风格迁移, 提示工程, 自然语言处理, 文本编辑, 语料库, 语言模型, 机器学习数据概述：...

ZIP

电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer

2025年5月29日

电商商品问答生成数据集E-commerceQuestionAnsweringGenerationDataset-cosmicrayer 数据来源：互联网公开数据标签：电商，问答生成，自然语言处理，数据集，文本生成，机器学习，信息检索，商品信息数据概述：该数据集包含电商平台上的商品信息和对应的问答对，用于训练和评估问答生成模型。主要特征如下：...

ZIP

自然语言处理Prompt生成数据集NaturalLanguageProcessingPromptGeneration-musabumiar2004

2025年5月29日

自然语言处理Prompt生成数据集NaturalLanguageProcessingPromptGeneration-musabumiar2004 数据来源：互联网公开数据标签：自然语言处理, Prompt工程, 文本生成, 提示词, 数据增强, 模型训练, 文本分析, 机器学习数据概述：...

ZIP

乌尔都语GPT对话数据集-laibaasmatullah

2025年5月29日

乌尔都语GPT对话数据集-laibaasmatullah 数据来源：互联网公开数据标签：自然语言处理，乌尔都语，对话，GPT，语言模型，文本生成，数据集，人工智能数据概述：该数据集包含基于GPT模型的乌尔都语对话数据，记录了用户与模型之间的交互内容。主要特征如下：时间跨度：数据记录的时间范围不固定，持续更新。...

ZIP

CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger

2025年5月29日

CodeBERT代码生成数据集CodeBERTCodeGenerationDataset-ducanger 数据来源：互联网公开数据标签：代码生成，自然语言处理，深度学习，代码理解，软件工程，数据集，编程，文本生成数据概述：该数据集包含由CodeBERT模型生成的代码数据，用于代码生成任务。主要特征如下：...

ZIP

人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii

2025年5月29日

人工智能角色扮演文本生成数据集ArtificialIntelligenceRole-PlayingTextGeneration-athviii 数据来源：互联网公开数据标签：人工智能, 文本生成, 角色扮演, 语言模型, 文本分析, 数据标注, 机器学习, 自然语言处理数据概述：...

ZIP

优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler

2025年5月29日

优化下一句生成数据集OptimizeNext-ParaphraseDataDataset-napoler 数据来源：互联网公开数据标签：自然语言处理，文本生成，机器学习，数据集，语言模型，序列到序列，文本重述，人工智能数据概述：该数据集包含用于优化下一句生成和同义改写的文本数据，记录了成对的原始句子和优化后的改写句子。主要特征如下：...

ZIP

孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif

2025年5月29日

孟加拉语文本摘要数据集BanglaTextSummarizationDataset-devtousif 数据来源：互联网公开数据标签：自然语言处理，文本摘要，数据集，机器学习，语言模型，文本分析，机器翻译，文本生成数据概述：该数据集包含孟加拉语文本的摘要数据，记录了孟加拉语文章及其对应的摘要信息。主要特征如下：...

ZIP

指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban

2025年5月29日

指令增强多视角文本生成数据集InstructionEnhancedMulti-ViewTextGenerationDataset-thuyban 数据来源：互联网公开数据标签：文本生成, 指令微调, 多视角, 数据增强, 自然语言处理, 深度学习, Prompt工程, 数据集构建数据概述：...

ZIP

GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03

2025年5月29日

GPT生成维基百科简介文本对比数据集GPT-WikiIntroductionTextComparison-prakharpradhan03 数据来源：互联网公开数据标签：自然语言处理, 文本生成, 维基百科, GPT模型, 文本对比, 摘要生成, 语言模型, 数据集数据概述：...

ZIP

写作质量评估与文本生成数据集WritingQualityAssessmentandTextGenerationDataset-laurensprast

2025年5月29日

写作质量评估与文本生成数据集WritingQualityAssessmentandTextGenerationDataset-laurensprast 数据来源：互联网公开数据标签：文本生成, 写作评估, 自然语言处理, 机器学习, 文本分类, 语料分析, 情感分析, 写作技巧数据概述：...

ZIP

开放助手对话数据集OASST1-SL-valterh

2025年5月29日

开放助手对话数据集OASST1-SL-valterh 数据来源：互联网公开数据标签：对话数据，自然语言处理，机器学习，情感分析，文本生成，对话系统，开源，多语言数据概述：该数据集包含来自开放助手（Open Assistant）项目的对话数据，主要记录了用户与AI助手的多轮对话内容。主要特征如下：...