找到646个数据集

标签: 文本生成

过滤结果
  • 双子星长文本数据集GeminiLongContextDataset-akinduhiman

    2025年4月25日   

    双子星长文本数据集GeminiLongContextDataset-akinduhiman 数据来源:互联网公开数据 标签:自然语言处理,长文本分析,数据集,机器学习,文本生成,语言模型,学术研究,人工智能 数据概述:该数据集包含来自双子星项目的长文本数据,记录了多种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • ArgRewritev2语料库数据集-nghtctrl

    2025年4月25日   

    ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
    packageimg
  • GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

    2025年4月25日   

    GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:...
    packageimg
  • 生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi

    2025年4月25日   

    生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源:互联网公开数据 标签:自然语言处理,生成式AI,数据集,机器学习,语言模型,文本生成,深度学习,人工智能 数据概述: 该数据集包含来自生成式预训练模型与大型语言模型(LLM)的研究数据,记录了模型在文本生成,语言理解等方面的表现。主要特征如下:...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg
  • 生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

    2025年4月25日   

    生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:...
    packageimg
  • 多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip

    2025年4月25日   

    多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip 数据来源:互联网公开数据 标签:深度学习,多头注意力,模型推理,自然语言处理,数据集,预测分析,机器翻译,文本生成 数据概述: 该数据集包含使用多头注意力机制模型进行推理预测的结果,主要用于评估和分析模型的性能。主要特征如下:...
    packageimg
  • 印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

    2025年4月24日   

    印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:...
    packageimg
  • 数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

    2025年4月24日   

    2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
    packageimg
  • 改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07

    2025年4月24日   

    改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14

    2025年4月24日   

    基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本生成,机器学习,数据挖掘,OpenAI,数据分析 数据概述: 该数据集包含由OpenAI模型生成的各种文本数据,涵盖了广泛的主题和应用场景。主要特征如下:...
    packageimg
  • 通义千问问答结果数据集Qwen-QAResultsDataset-bartamin

    2025年4月24日   

    通义千问问答结果数据集Qwen-QAResultsDataset-bartamin 数据来源:互联网公开数据 标签:问答,自然语言处理,数据集,文本生成,模型评估,机器学习,人工智能,语言模型 数据概述: 该数据集包含了通义千问(Qwen)大语言模型的问答结果,记录了模型对不同问题的回答。主要特征如下: 时间跨度:数据记录的时间范围为发布时间。...
    packageimg
  • 自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor

    2025年4月24日   

    自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor 数据来源:互联网公开数据 标签:自然语言处理,文本到文本,数据集,机器学习,深度学习,语言模型,翻译,文本生成 数据概述: 该数据集包含自然语言处理中的文本到文本转换任务数据,记录了输入文本和对应的输出文本。主要特征如下: 时间跨度:...
    packageimg
  • 人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara

    2025年4月24日   

    人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源:互联网公开数据 标签:人工智能,电子邮件,数据集,自然语言处理,文本生成,机器学习,文本分析,文本挖掘 数据概述: 该数据集包含由人工智能生成的电子邮件数据,记录了不同主题和场景下的电子邮件内容。主要特征如下:...
    packageimg
  • 增强版Fairseq模型训练数据集-arinaruck

    2025年4月24日   

    增强版Fairseq模型训练数据集-arinaruck 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,文本生成,数据集,深度学习,Fairseq,模型训练,人工智能 数据概述: 该数据集是用于训练和评估增强版Fairseq模型的文本数据集合,旨在提升模型在自然语言处理任务中的性能。主要特征如下: 时间跨度:...
    packageimg
  • 孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom

    2025年4月24日   

    孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,句子转换,数据集,文本生成,语言学,机器翻译,文本分析 数据概述: 该数据集包含孟加拉语的句子转换数据,记录了孟加拉语句子在不同语法结构和表达方式下的多种转换形式。主要特征如下:...
    packageimg
  • Mistral提示数据集MistralPromptDataset-isrswsiser

    2025年4月24日   

    Mistral提示数据集MistralPromptDataset-isrswsiser 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,机器学习,语言模型,文本生成,人工智能,深度学习 数据概述: 该数据集包含来自Mistral项目的提示数据,记录了用于训练和优化语言模型的提示样本。主要特征如下:...
    packageimg
  • 元学习语言模型数据集Meta-LLMsDataset-daqueen

    2025年4月24日   

    元学习语言模型数据集Meta-LLMsDataset-daqueen 数据来源:互联网公开数据 标签:语言模型,元学习,数据集,自然语言处理,机器学习,人工智能,深度学习,文本生成 数据概述:该数据集包含了来自多个来源的文本数据,用于训练和评估元学习语言模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2023年。...
    packageimg
  • YouTube视频摘要机器人数据集2022年-mykytafilipenko

    2025年4月24日   

    YouTube视频摘要机器人数据集2022年-mykytafilipenko 数据来源:互联网公开数据 标签:YouTube, 视频摘要, 数据集, 自然语言处理, 机器学习, 文本生成, 视频分析, 人工智能 数据概述: 该数据集包含来自YouTube视频摘要机器人的数据,记录了用户上传的视频及其对应的自动生成功能生成的摘要。主要特征如下:...
    packageimg