-
大型语言模型Mistral7B指令文本数据集LLMMistral7BInstructTextsDataset-wu468ef
大型语言模型Mistral7B指令文本数据集LLMMistral7BInstructTextsDataset-wu468ef 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本生成,语言模型,指令学习,人工智能,深度学习 数据概述: 该数据集包含来自Mistral... -
餐厅概览摘要数据集RestaurantOverviewSummarizationDataset-kjeevan
餐厅概览摘要数据集RestaurantOverviewSummarizationDataset-kjeevan 数据来源:互联网公开数据 标签:餐厅,摘要,自然语言处理,文本生成,数据集,餐饮业,信息抽取,人工智能 数据概述: 该数据集包含来自互联网的餐厅信息,主要用于生成餐厅概览摘要。主要特征如下:... -
强化学习与人类反馈数据RLHF数据集-devanshumahapatra
强化学习与人类反馈数据RLHF数据集-devanshumahapatra 数据来源:互联网公开数据 标签:强化学习,人类反馈,数据集,自然语言处理,文本生成,模型训练,人工智能,语言模型 数据概述: 该数据集包含了用于强化学习与人类反馈(RLHF)技术的数据,主要用于训练语言模型,使其生成更符合人类偏好的文本。主要特征如下:... -
大规模语言模型增强数据集LLMAugmentedData-zhenghao97
大规模语言模型增强数据集LLMAugmentedData-zhenghao97 数据来源:互联网公开数据 标签:语言模型,数据集,数据增强,自然语言处理,文本生成,机器学习,文本分析,人工智能 数据概述: 该数据集包含由大规模语言模型(LLM)生成和增强的文本数据,旨在用于训练和评估各种自然语言处理(NLP)模型。主要特征如下:... -
文本重写语料库句子对数据集ArgRewriteV2句子对数据集-nghtctrl
文本重写语料库句子对数据集ArgRewriteV2句子对数据集-nghtctrl 数据来源:互联网公开数据 标签:文本重写,数据集,自然语言处理,机器学习,文本生成,语言模型,对齐数据,语义分析 数据概述: 该数据集来自 ArgRewrite 项目,主要包含用于文本重写的句子对数据,适用于自然语言处理和机器学习任务。主要特征如下:... -
Flick30图像描述增强数据集EnhancingCaptionsforFlick30Dataset-yazanaboassa
Flick30图像描述增强数据集EnhancingCaptionsforFlick30Dataset-yazanaboassa 数据来源:互联网公开数据 标签:图像描述,数据集,自然语言处理,计算机视觉,机器学习,文本生成,数据增强,人工智能 数据概述:... -
葡萄牙语诗歌作品集数据库-巴西诗人诗歌-多时期-oliveirasp6
葡萄牙语诗歌作品集数据库-巴西诗人诗歌-多时期-oliveirasp6 数据来源:互联网公开数据 标签:诗歌,葡萄牙语,文学,巴西,文本分析,自然语言处理,情感分析,文本生成 数据概述:... -
高分辨率名人脸部图像描述数据集CelebA-HQCaptionsDataset-m7mdelganainy
高分辨率名人脸部图像描述数据集CelebA-HQCaptionsDataset-m7mdelganainy 数据来源:互联网公开数据 标签:图像描述,人脸识别,数据集,自然语言处理,计算机视觉,深度学习,图像生成,文本生成 数据概述: 该数据集包含 CelebA-HQ 数据集中高分辨率名人脸部图像及其对应的文本描述。主要特征如下:... -
数据4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873
4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,文本生成,AI检测,机器学习,数据集,文本分类,深度学习,学术研究 数据概述: 该数据集包含由Mixtral... -
大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q
大规模语言模型训练数据集LargeLanguageModelTrainingData-z1qz1q 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,文本生成,深度学习 数据概述: 该数据集包含大规模的文本数据,主要用于训练大型语言模型。主要特征如下:... -
语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha
语言模型诗歌生成数据集-100首诗歌-2023年-imbikramsaha 数据来源:互联网公开数据 标签:诗歌,语言模型,NLP,文本生成,机器学习,教育,学习资源 数据概述: 本数据集包含100首诗歌,适用于语言模型的文本生成任务。数据集中的诗歌涵盖了不同的风格和主题,包括抒情诗、叙事诗和自由诗等,为训练语言模型提供了丰富的文本素材。... -
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas
英语模板数据集EnglishTemplatedDataset-rnaveensrinivas 数据来源:互联网公开数据 标签:英语学习,文本分析,数据集,自然语言处理,语言模型,文本生成,语料库,写作辅助 数据概述: 该数据集包含来自各种来源的英语文本数据,旨在为英语学习和自然语言处理研究提供支持。主要特征如下:... -
十大说唱歌手作品文本分析数据集-2023-ngxdtv
十大说唱歌手作品文本分析数据集-2023-ngxdtv 数据来源:互联网公开数据 标签:说唱音乐,文本分析,自然语言处理,机器学习,文本分类,情感分析,主题建模,文本生成,语言模型,语音识别 数据概述: 本数据集包含超过2600首由十个不同说唱歌手创作的作品文本,其中包括Ali As、Alligatoah、Kollegah和Kool... -
印度孟加拉语自由诗歌数据集2021-truthr
印度孟加拉语自由诗歌数据集2021-truthr 数据来源:互联网公开数据 标签:孟加拉语,诗歌,数据集,免费资源,自然语言处理,文本生成,预训练模型,下游任务,CC-BY-SA 4.0 数据概述:... -
孟加拉语指令数据集-多样化和高质量-shanto8
孟加拉语指令数据集-多样化和高质量-shanto8 数据来源:互联网公开数据 标签:孟加拉语,指令,自然语言处理,教育,翻译,语义理解,文本生成,文化传承,技术文档 数据概述:... -
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99
语言模型训练与评估数据集ParaphraseTrainingDataset-sarahsnider99 数据来源:互联网公开数据 标签:语言模型,文本生成,数据集,自然语言处理,机器学习,文本分析,语义理解,人工智能 数据概述: 该数据集包含用于语言模型训练和评估的文本数据,记录了多种文本的语义变换和生成任务。主要特征如下:... -
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass
生成式人工智能应用数据集GenerativeAIApplicationsDataset-niyamatalmass 数据来源:互联网公开数据 标签:人工智能,生成式AI,数据集,机器学习,自然语言处理,图像生成,文本生成,多模态学习... -
全球GPT-1N外部模型评估数据集-sasrdw
全球GPT-1N外部模型评估数据集-sasrdw 数据来源:互联网公开数据 标签:自然语言处理,模型评估,GPT-1N,语言模型,数据集,文本生成,文本分析,人工智能,机器学习 数据概述: 该数据集包含了用于评估GPT-1N外部模型性能的各种测试数据,旨在全面衡量模型在不同任务上的表现。主要特征如下: 时间跨度:数据收集时间跨度不固定,持续更新。... -
CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223
CLIP文本生成数据集主题-场景-对象-时间数据集CLIPTextGenerationDataset-anantjain1223 数据来源:互联网公开数据 标签:文本生成,数据集,机器学习,自然语言处理,计算机视觉,多模态学习,图像描述,AI技术... -
图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar
图像描述生成数据集ImageDescriptionGenerationDataset-daneshwarisavadkar 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像标注,人工智能,文本生成 数据概述: 该数据集包含图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下:...