-
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks
大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:...
-
问答系统评估数据集Qwen-AnswersDataset-martintura
问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:...
-
Quora语句改写数据集QuoraParaphrasingDataset-fbgame123
Quora语句改写数据集QuoraParaphrasingDataset-fbgame123 数据来源:互联网公开数据 标签:自然语言处理,文本改写,数据集,机器学习,语义相似度,语言模型,文本生成,人工智能 数据概述: 该数据集来源于Quora平台,包含了用户提问的原始语句及对应的改写版本,用于研究语句改写和语义相似度分析。主要特征如下:...
-
测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj
测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj 数据来源:互联网公开数据 标签:对话系统,语言模型,数据集,自然语言处理,机器学习,人工智能,文本生成,比较分析 数据概述: 该数据集包含了Misral...
-
合成心理健康对话数据集-denisemtatih
合成心理健康对话数据集-denisemtatih 数据来源:互联网公开数据 标签:心理健康,对话,数据集,自然语言处理,情感分析,文本生成,机器学习,人机交互 数据概述: 该数据集包含合成的心理健康对话记录,旨在模拟患者与治疗师或支持性人工智能之间的交流。主要特征如下: 时间跨度:数据记录未明确时间跨度,主要关注对话内容和情感表达。...
-
贝叶斯方法微调大型语言模型数据集LLM-finetuningBayesianDataset-tylerchun91
贝叶斯方法微调大型语言模型数据集LLM-finetuningBayesianDataset-tylerchun91 数据来源:互联网公开数据 标签:大型语言模型,贝叶斯方法,微调,数据集,自然语言处理,机器学习,模型优化,文本生成 数据概述: 该数据集包含用于贝叶斯方法微调大型语言模型的数据,旨在提升模型性能和泛化能力。主要特征如下:...
-
生成式数据集2000年GenerateDF2000-mandrilator
生成式数据集2000年GenerateDF2000-mandrilator 数据来源:互联网公开数据 标签:生成数据,数据集,机器学习,自然语言处理,文本生成,人工智能,数据科学,语言模型 数据概述:该数据集包含来自互联网的多样化文本数据,主要记录了2000年期间的文本信息,适用于生成式模型的训练和文本生成任务。主要特征如下:...
-
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92
EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
-
生成式图像标题数据集GenerateCaptionsDataset-ilhamdirgantara
生成式图像标题数据集GenerateCaptionsDataset-ilhamdirgantara 数据来源:互联网公开数据 标签:图像识别,自然语言处理,数据集,生成式模型,计算机视觉,人工智能,机器学习,文本生成 数据概述: 该数据集包含来自公开图像资源的数据,记录了图像与对应标题的配对信息。主要特征如下:...
-
自然语言处理BeamSearch结果数据集-r00man
自然语言处理BeamSearch结果数据集-r00man 数据来源:互联网公开数据 标签:自然语言处理,Beam Search,数据集,文本生成,机器翻译,序列标注,深度学习,模型评估 数据概述: 该数据集包含了使用Beam Search算法生成的自然语言处理任务结果。主要特征如下: 时间跨度:数据生成时间为特定任务训练和推理的时间。...
-
诗歌生成数据集PoemGenerationDataset-neorangna
诗歌生成数据集PoemGenerationDataset-neorangna 数据来源:互联网公开数据 标签:自然语言处理,诗歌,文本生成,机器学习,中文数据,文学创作,深度学习,数据集 数据概述: 该数据集包含来自中文诗歌创作的大量文本数据,记录了不同风格和体裁的古代及现代诗歌作品。主要特征如下:...
-
Midjourney随机生成图像提示语数据集-百万条
Midjourney随机生成图像提示语数据集-百万条 数据来源:互联网公开数据 标签:Midjourney,图像生成,AI绘画,提示词,文本生成,随机,创作灵感,艺术,数据集 数据概述:...
-
生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand
生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,文本对比,语言模型,人工智能,数据科学 数据概述:...
-
对话数据集样本ConvoDatasetSample-rigveddesai
对话数据集样本ConvoDatasetSample-rigveddesai 数据来源:互联网公开数据 标签:对话,文本,自然语言处理,数据集,语言模型,情感分析,文本生成,聊天机器人 数据概述: 该数据集包含对话文本样本,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时间段的对话。...
-
提示词数据集PromptsDataset1-sandeepnambiar02
提示词数据集PromptsDataset1-sandeepnambiar02 数据来源:互联网公开数据 标签:自然语言处理,数据集,提示工程,人工智能,机器学习,文本生成,语言模型,数据挖掘 数据概述: 该数据集专注于收集各类提示词(prompts),记录了不同场景下的文本提示信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
-
人工智能提示词训练数据集TrainingPromptsforAIDataset-antoniabeatrizsoler
人工智能提示词训练数据集TrainingPromptsforAIDataset-antoniabeatrizsoler 数据来源:互联网公开数据 标签:人工智能,提示词,数据集,自然语言处理,机器学习,文本生成,模型训练,Prompt Engineering 数据概述:...
-
语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet
语法修正说服文本数据集Grammar-CorrectedPersuasiveTextDataset2023-defdet 数据来源:互联网公开数据 标签:语法修正,说服文本,自然语言处理,文本分析,机器学习,语言学,数据集,文本生成 数据概述: 该数据集包含经过语法修正的说服性文本数据,适用于自然语言处理和文本生成等任务。主要特征如下:...
-
LLM生成的论文数据集LLM-GeneratedEssaysDataset-diacious
LLM生成的论文数据集LLM-GeneratedEssaysDataset-diacious 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,论文写作,学术研究,机器学习,写作评估,人工智能 数据概述:该数据集包含由大型语言模型(LLM)生成的论文,涵盖多种主题和写作风格。主要特征如下:...
-
新闻摘要生成数据集NewsSummaryGenerationDataset-diwakarshukla74
新闻摘要生成数据集NewsSummaryGenerationDataset-diwakarshukla74 数据来源:互联网公开数据 标签:新闻摘要,自然语言处理,文本生成,数据集,机器学习,文本处理,信息提取,人工智能 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的摘要,记录了新闻内容与摘要之间的映射关系。主要特征如下:...
-
生成的图像字幕数据集GeneratedCaptionsModel2Dataset-drithidavuluri
生成的图像字幕数据集GeneratedCaptionsModel2Dataset-drithidavuluri 数据来源:互联网公开数据 标签:图像字幕,数据集,自然语言处理,计算机视觉,深度学习,文本生成,人工智能,多媒体 数据概述: 该数据集包含来自Generated Captions Model...



