-
大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda
大型语言模型总结能力评估数据集CivilSum-PHIDataset-veerchheda 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,大型语言模型,评估数据集,模型测评,文本生成,人工智能,学术研究 数据概述: 该数据集包含用于评估大型语言模型(LLM)总结能力的文本数据。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。...
-
图像标注数据集Caption-THDataset-yaomingzz
图像标注数据集Caption-THDataset-yaomingzz 数据来源:互联网公开数据 标签:图像标注,数据集,计算机视觉,自然语言处理,图像识别,机器学习,视觉理解,文本生成 数据概述: 该数据集包含大量图像及其对应的文本描述,记录了图像内容与文字标注的配对数据。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为近期数据。...
-
基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye
基于ChatGPT的邮政编码生成数据集PostcodeGeneratorUsingChatGPTDataset-oladayoowoeye 数据来源:互联网公开数据 标签:邮政编码,数据生成,自然语言处理,人工智能,机器学习,数据集,文本生成,智能编码 数据概述:...
-
GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr
GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,深度学习,文本分析 数据概述:该数据集包含了由GPT4再生成的语言模型数据,适用于自然语言处理,文本生成等任务。主要特征如下:...
-
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi
通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:...
-
文本生成预测数据集NextWordGenerateDataset-anirudhasutar
文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源:互联网公开数据 标签:文本生成,数据集,自然语言处理,机器学习,人工智能,语言模型,文本预测,深度学习 数据概述:该数据集包含用于文本生成预测的数据,记录了大量文本数据以训练和评估语言模型。主要特征如下:...
-
ArgRewritev2语料库数据集-nghtctrl
ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
-
GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12
GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:...
-
生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi
生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源:互联网公开数据 标签:自然语言处理,生成式AI,数据集,机器学习,语言模型,文本生成,深度学习,人工智能 数据概述: 该数据集包含来自生成式预训练模型与大型语言模型(LLM)的研究数据,记录了模型在文本生成,语言理解等方面的表现。主要特征如下:...
-
GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri
GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
-
生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602
生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:...
-
多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip
多头模型推理预测数据集MultiheadModelInferencePredictionDataset-datavip 数据来源:互联网公开数据 标签:深度学习,多头注意力,模型推理,自然语言处理,数据集,预测分析,机器翻译,文本生成 数据概述: 该数据集包含使用多头注意力机制模型进行推理预测的结果,主要用于评估和分析模型的性能。主要特征如下:...
-
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:...
-
数据2024中国计算机学会CCF检索增强生成RAG数据集-yxw666
2024中国计算机学会CCF检索增强生成RAG数据集-yxw666 数据来源:互联网公开数据 标签:自然语言处理,检索增强生成,数据集,文本生成,信息检索,机器学习,人工智能,CCF 数据概述: 该数据集由中国计算机学会(CCF)提供,旨在促进检索增强生成(RAG)技术的研究与发展。主要特征如下: 时间跨度:数据记录的时间范围为2024年。...
-
改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07
改进型图像字幕数据集ImprovedCaptionsDataset-sameerbairwa07 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,视觉理解,人工智能 数据概述: 该数据集包含经过改进的图像字幕数据,记录了与图像内容相匹配的,经过优化的描述性文本。主要特征如下:...
-
文本生成模型Gemma数据集-minhsienweng
文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
-
基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14
基于OpenAI生成的数据集DS3GeneratedDatafromOpenAI-devayani14 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本生成,机器学习,数据挖掘,OpenAI,数据分析 数据概述: 该数据集包含由OpenAI模型生成的各种文本数据,涵盖了广泛的主题和应用场景。主要特征如下:...
-
自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor
自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor 数据来源:互联网公开数据 标签:自然语言处理,文本到文本,数据集,机器学习,深度学习,语言模型,翻译,文本生成 数据概述: 该数据集包含自然语言处理中的文本到文本转换任务数据,记录了输入文本和对应的输出文本。主要特征如下: 时间跨度:...
-
人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara
人工智能生成电子邮件数据集AIGeneratedEmailsDataset-guchiopara 数据来源:互联网公开数据 标签:人工智能,电子邮件,数据集,自然语言处理,文本生成,机器学习,文本分析,文本挖掘 数据概述: 该数据集包含由人工智能生成的电子邮件数据,记录了不同主题和场景下的电子邮件内容。主要特征如下:...
-
增强版Fairseq模型训练数据集-arinaruck
增强版Fairseq模型训练数据集-arinaruck 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,文本生成,数据集,深度学习,Fairseq,模型训练,人工智能 数据概述: 该数据集是用于训练和评估增强版Fairseq模型的文本数据集合,旨在提升模型在自然语言处理任务中的性能。主要特征如下: 时间跨度:...



