数据集 - 海数据

大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda

2025年4月25日

大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda 数据来源：互联网公开数据标签：文本摘要，自然语言处理，大型语言模型，评估数据集，模型测评，文本生成，人工智能，学术研究数据概述：该数据集包含用于评估大型语言模型（LLM）总结能力的文本数据。主要特征如下：时间跨度：数据收集时间跨度不限，持续更新。...

ZIP

图像标注数据集Caption-THDataset-yaomingzz

2025年4月25日

图像标注数据集Caption-THDataset-yaomingzz 数据来源：互联网公开数据标签：图像标注，数据集，计算机视觉，自然语言处理，图像识别，机器学习，视觉理解，文本生成数据概述：该数据集包含大量图像及其对应的文本描述，记录了图像内容与文字标注的配对数据。主要特征如下：时间跨度：数据记录的时间范围不明确，主要为近期数据。...

ZIP

基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye

2025年4月25日

基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye 数据来源：互联网公开数据标签：邮政编码，数据生成，自然语言处理，人工智能，机器学习，数据集，文本生成，智能编码数据概述：...

ZIP

GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr

2025年4月25日

GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，文本生成，语言模型，人工智能，深度学习，文本分析数据概述：该数据集包含了由GPT4再生成的语言模型数据，适用于自然语言处理，文本生成等任务。主要特征如下：...

ZIP

通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi

2025年4月25日

通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，机器学习，文本生成，语言模型，人工智能，教育技术数据概述：该数据集包含用于文本摘要生成任务的通用测试数据，记录了多个文本及其对应的摘要信息。主要特征如下：...

ZIP

文本生成预测数据集NextWordGenerateDataset-anirudhasutar

2025年4月25日

文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源：互联网公开数据标签：文本生成，数据集，自然语言处理，机器学习，人工智能，语言模型，文本预测，深度学习数据概述：该数据集包含用于文本生成预测的数据，记录了大量文本数据以训练和评估语言模型。主要特征如下：...

ZIP

ArgRewritev2语料库数据集-nghtctrl

2025年4月25日

ArgRewritev2语料库数据集-nghtctrl 数据来源：互联网公开数据标签：自然语言处理，语料库，文本生成，机器翻译，文本重写，数据集，语言模型，文本分析数据概述：该数据集包含 ArgRewrite v2 语料库的数据，记录了文本重写任务的多种变体。主要特征如下：时间跨度：数据记录的时间范围为数据集构建和发布时间。...

ZIP

GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

2025年4月25日

GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，语言模型，文本生成，深度学习，人工智能，模型微调数据概述：该数据集包含用于微调GPT-2语言模型的数据，主要记录了文本数据及其相关的标注信息。主要特征如下：...

ZIP

生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi

2025年4月25日

生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源：互联网公开数据标签：自然语言处理，生成式AI，数据集，机器学习，语言模型，文本生成，深度学习，人工智能数据概述：该数据集包含来自生成式预训练模型与大型语言模型（LLM）的研究数据，记录了模型在文本生成，语言理解等方面的表现。主要特征如下：...

ZIP

GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

2025年4月25日

GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源：互联网公开数据标签：自然语言处理，数据集，印尼语，GPT-2，文本生成，语言模型，机器翻译，文本分析数据概述：该数据集包含了印尼语文本数据，旨在用于训练和评估GPT-2模型，从而提升印尼语文本生成，翻译等相关任务的性能。主要特征如下：...

ZIP

生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

2025年4月25日

生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源：互联网公开数据标签：文本生成，自然语言处理，数据集，机器学习，文本分析，人工智能，语言模型，文本挖掘数据概述：该数据集包含来自多个公开源文本生成的数据，记录了不同场景下的文本内容和特征。主要特征如下：...

ZIP

多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip

2025年4月25日

多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip 数据来源：互联网公开数据标签：深度学习，多头注意力，模型推理，自然语言处理，数据集，预测分析，机器翻译，文本生成数据概述：该数据集包含使用多头注意力机制模型进行推理预测的结果，主要用于评估和分析模型的性能。主要特征如下：...

ZIP

印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

2025年4月24日

印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源：互联网公开数据标签：自然语言处理，印地语，数据集，语言模型，机器学习，文本生成，数据增强，多语言处理数据概述：该数据集包含用于印地语大语言模型训练和评估的数据，记录了印地语的文本生成任务所需的数据样本。主要特征如下：...

ZIP

数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666

2025年4月24日

2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源：互联网公开数据标签：自然语言处理，检索增强生成，数据集，文本生成，信息检索，机器学习，人工智能，CCF 数据概述：该数据集由中国计算机学会（CCF）提供，旨在促进检索增强生成（RAG）技术的研究与发展。主要特征如下：时间跨度：数据记录的时间范围为2024年。...

ZIP

改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07

2025年4月24日

改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源：互联网公开数据标签：图像字幕，数据集，自然语言处理，计算机视觉，深度学习，文本生成，视觉理解，人工智能数据概述：该数据集包含经过改进的图像字幕数据，记录了与图像内容相匹配的，经过优化的描述性文本。主要特征如下：...

ZIP

文本生成模型Gemma数据集-minhsienweng

2025年4月24日

文本生成模型Gemma数据集-minhsienweng 数据来源：互联网公开数据标签：文本生成，机器学习，自然语言处理，数据集，人工智能，语言模型，深度学习，文本分析...

ZIP

基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14

2025年4月24日

基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源：互联网公开数据标签：人工智能，数据集，自然语言处理，文本生成，机器学习，数据挖掘，OpenAI，数据分析数据概述：该数据集包含由OpenAI模型生成的各种文本数据，涵盖了广泛的主题和应用场景。主要特征如下：...

ZIP

自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor

2025年4月24日

自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor 数据来源：互联网公开数据标签：自然语言处理，文本到文本，数据集，机器学习，深度学习，语言模型，翻译，文本生成数据概述：该数据集包含自然语言处理中的文本到文本转换任务数据，记录了输入文本和对应的输出文本。主要特征如下：时间跨度：...

ZIP

人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara

2025年4月24日

人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源：互联网公开数据标签：人工智能，电子邮件，数据集，自然语言处理，文本生成，机器学习，文本分析，文本挖掘数据概述：该数据集包含由人工智能生成的电子邮件数据，记录了不同主题和场景下的电子邮件内容。主要特征如下：...

ZIP

增强版Fairseq模型训练数据集-arinaruck

2025年4月24日

增强版Fairseq模型训练数据集-arinaruck 数据来源：互联网公开数据标签：自然语言处理，机器翻译，文本生成，数据集，深度学习，Fairseq，模型训练，人工智能数据概述：该数据集是用于训练和评估增强版Fairseq模型的文本数据集合，旨在提升模型在自然语言处理任务中的性能。主要特征如下：时间跨度：...

ZIP

找到687个数据集

注册成功！