数据集 - 海数据

图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss

2025年4月24日

图像描述生成数据集ImageDescriptionGenerationDataset-shredharsssss 数据来源：互联网公开数据标签：图像描述，数据集，计算机视觉，自然语言处理，深度学习，图像标注，人工智能，文本生成数据概述：该数据集包含图像及其对应的文本描述，旨在促进图像描述生成任务的研究和应用。主要特征如下：...

ZIP

高质量提示词数据集PolishedPromptsDataset-dmitriyab

2025年4月24日

高质量提示词数据集PolishedPromptsDataset-dmitriyab 数据来源：互联网公开数据标签：自然语言处理，提示词工程，数据集，机器学习，文本生成，人工智能，语言模型，提示优化数据概述：该数据集包含经过精心设计和优化的提示词（prompts），用于自然语言处理任务，特别是大语言模型的文本生成。主要特征如下：...

ZIP

测试训练上下文大型语言模型数据集-quctngngvng

2025年4月24日

测试训练上下文大型语言模型数据集-quctngngvng 数据来源：互联网公开数据标签：大型语言模型，数据集，自然语言处理，文本生成，机器学习，模型训练，语言模型，上下文学习数据概述：该数据集包含用于训练和评估大型语言模型（LLM）的文本数据，专注于测试训练（Test-Train）场景下的上下文学习能力。主要特征如下：时间跨度：...

ZIP

开放图片描述数据集CaptionsDatasetPublic-mahipalimkar

2025年4月24日

开放图片描述数据集CaptionsDatasetPublic-mahipalimkar 数据来源：互联网公开数据标签：图像描述，自然语言处理，计算机视觉，数据集，文本生成，图像识别，多模态学习，人工智能数据概述：该数据集包含了大量图像及其对应的文本描述，旨在用于图像描述生成任务。主要特征如下：时间跨度：数据收集时间跨度不限，持续更新。...

ZIP

大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57

2025年4月24日

大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源：互联网公开数据标签：自然语言处理，文本生成，文本校对，数据集，机器翻译，语言模型，文本纠错，人工智能数据概述：该数据集基于 Google 的大型语言模型 T5，记录了大规模文本生成和校对的数据。主要特征如下：...

ZIP

自然语言处理作业三测试数据集-hangman1998

2025年4月24日

自然语言处理作业三测试数据集-hangman1998 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分类，情感分析，机器翻译，文本生成，深度学习，NLP 数据概述：该数据集包含了多个用于自然语言处理任务的测试数据，旨在评估和验证NLP模型的效果。主要特征如下：时间跨度：数据收集时间不限，涵盖不同年份的文本数据。...

ZIP

医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34

2025年4月24日

医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34 数据来源：互联网公开数据标签：医疗，GPT，问答，数据集，自然语言处理，医学，知识图谱，文本生成数据概述：该数据集包含了从互联网上抓取的医疗相关问答数据，旨在用于训练和评估GPT模型在医疗领域的应用。主要特征如下：...

ZIP

Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADatas...

2025年4月24日

Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADataset-alvations 数据来源：互联网公开数据标签：自然语言处理，同义改写，数据集，机器学习，语义分析，文本生成，问答系统，数据挖掘数据概述：...

ZIP

大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad

2025年4月24日

大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源：互联网公开数据标签：人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本数据概述：...

ZIP

文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj

2025年4月24日

文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj 数据来源：互联网公开数据标签：自然语言处理，文本重写，数据集，机器学习，文本生成，语言模型，深度学习，数据科学数据概述：该数据集包含用于训练和测试文本重写模型的平行文本数据，记录了原始文本及其对应的重写版本。主要特征如下：...

ZIP

BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige

2025年4月24日

BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，情感分析，机器翻译，文本生成，深度学习，BERT模型数据概述：该数据集包含了用于训练和评估BERT模型的基础文本数据，用于构建BERT模型的基线实验。主要特征如下：...

ZIP

大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer

2025年4月24日

大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源：互联网公开数据标签：大语言模型，提示恢复，数据集，自然语言处理，机器学习，人工智能，文本生成，对话系统数据概述：该数据集包含用于大语言模型提示恢复的文本数据，记录了原始提示和相应的恢复提示。主要特征如下：...

ZIP

食谱生成数据集RecipeGenerationDataset-thakkarhiren

2025年4月24日

食谱生成数据集RecipeGenerationDataset-thakkarhiren 数据来源：互联网公开数据标签：食谱，菜谱，烹饪，数据集，自然语言处理，文本生成，机器学习，菜品推荐数据概述：该数据集包含来自互联网的食谱数据，记录了各种菜肴的制作方法和相关信息。主要特征如下：时间跨度：数据记录的时间范围不限，覆盖了不同年代和地区的菜谱。...

ZIP

WebGPT与OpenAI模型性能对比数据集

2025年4月24日

WebGPT与OpenAI模型性能对比数据集数据来源：互联网公开数据标签：WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统数据概述：...

ZIP

组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet

2025年4月24日

组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源：互联网公开数据标签：故事文本，数据集，自然语言处理，文本分析，机器学习，文本生成，数据分析，语言模型数据概述：该数据集包含来自多个来源的组合故事文本数据，记录了各类故事文本的内容和结构。主要特征如下：...

ZIP

大型语言模型生成文本检测竞赛用文集-2023年-phanisrikanth

2025年4月23日

大型语言模型生成文本检测竞赛用文集-2023年-phanisrikanth 数据来源：互联网公开数据标签：LLM,文本生成,人工智能检测,竞赛数据,英特尔,神经网络,生成文本,论文集数据概述：本数据集包含3500篇由大型语言模型（LLM）生成的论文，这些论文是为“Detect AI Generated Text...

ZIP

性别中立与包容性文本数据集-pravinkalse

2025年4月23日

性别中立与包容性文本数据集-pravinkalse 数据来源：互联网公开数据标签：性别中立，包容性，文本分析，自然语言处理，社会科学，语言模型，数据集，文本生成数据概述：该数据集包含来自互联网的文本数据，旨在促进对性别中立和包容性语言的研究与应用。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了不同时期和来源的文本。...

ZIP

大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98

2025年4月23日

大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源：互联网公开数据标签：自然语言处理，大型语言模型，数据集，LLaMA，开源，文本生成，机器学习，预训练数据概述：...

ZIP

随机诗歌数据集RandomPoemsDataset-garried

2025年4月23日

随机诗歌数据集RandomPoemsDataset-garried 数据来源：互联网公开数据标签：诗歌，文学，自然语言处理，文本分析，数据集，文化研究，机器学习，文本生成数据概述：该数据集包含来自公开诗歌资源的随机诗歌数据，记录了不同风格和主题的诗歌作品。主要特征如下：时间跨度：数据记录的时间范围从古代到现代，包含不同历史时期的诗歌作品。...

ZIP

Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham

2025年4月23日

Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源：互联网公开数据标签：人工智能，自然语言处理，数据集，机器学习，文本生成，语言模型，深度学习，数据增强数据概述：该数据集由Mistral模型生成，包含大量文本数据，适用于自然语言处理和机器学习任务。主要特征如下：...

ZIP

找到687个数据集

注册成功！