-
开放图片描述数据集CaptionsDatasetPublic-mahipalimkar
开放图片描述数据集CaptionsDatasetPublic-mahipalimkar 数据来源:互联网公开数据 标签:图像描述,自然语言处理,计算机视觉,数据集,文本生成,图像识别,多模态学习,人工智能 数据概述: 该数据集包含了大量图像及其对应的文本描述,旨在用于图像描述生成任务。主要特征如下: 时间跨度:数据收集时间跨度不限,持续更新。... -
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57
大规模文本生成与校对数据集BYT5-CorrectedDataset-jakir57 数据来源:互联网公开数据 标签:自然语言处理,文本生成,文本校对,数据集,机器翻译,语言模型,文本纠错,人工智能 数据概述: 该数据集基于 Google 的大型语言模型 T5,记录了大规模文本生成和校对的数据。主要特征如下:... -
自然语言处理作业三测试数据集-hangman1998
自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。... -
医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34
医疗领域GPT问答数据集WebScrappedMedicalGPTDataset-tombraider34 数据来源:互联网公开数据 标签:医疗,GPT,问答,数据集,自然语言处理,医学,知识图谱,文本生成 数据概述: 该数据集包含了从互联网上抓取的医疗相关问答数据,旨在用于训练和评估GPT模型在医疗领域的应用。主要特征如下:... -
Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADatas...
Quora-Paraphrase-Stackoverflow-Q-A同义改写数据集QuoraParaphraseStackoverflowQ-ADataset-alvations 数据来源:互联网公开数据 标签:自然语言处理,同义改写,数据集,机器学习,语义分析,文本生成,问答系统,数据挖掘 数据概述:... -
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad
大型语言模型生成文本检测数据集-Llama70B与Falcon180B对抗文本数据集-nbroad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,机器学习,模型评估,语言模型,Llama 70B, Falcon 180B,文本检测,DAIGT,对抗样本 数据概述:... -
文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj
文本重写训练与测试数据集ParaphraserTrainingandTestSet-pravinkumardurairaj 数据来源:互联网公开数据 标签:自然语言处理,文本重写,数据集,机器学习,文本生成,语言模型,深度学习,数据科学 数据概述: 该数据集包含用于训练和测试文本重写模型的平行文本数据,记录了原始文本及其对应的重写版本。主要特征如下:... -
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:... -
大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer
大语言模型提示恢复提示数据集LLMPromptRecoveryDataset-nedomer 数据来源:互联网公开数据 标签:大语言模型,提示恢复,数据集,自然语言处理,机器学习,人工智能,文本生成,对话系统 数据概述:该数据集包含用于大语言模型提示恢复的文本数据,记录了原始提示和相应的恢复提示。主要特征如下:... -
食谱生成数据集RecipeGenerationDataset-thakkarhiren
食谱生成数据集RecipeGenerationDataset-thakkarhiren 数据来源:互联网公开数据 标签:食谱,菜谱,烹饪,数据集,自然语言处理,文本生成,机器学习,菜品推荐 数据概述: 该数据集包含来自互联网的食谱数据,记录了各种菜肴的制作方法和相关信息。主要特征如下: 时间跨度:数据记录的时间范围不限,覆盖了不同年代和地区的菜谱。... -
WebGPT与OpenAI模型性能对比数据集
WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:... -
组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet
组合故事文本数据集CombinedStoriesTextDataset-ahmadrezacuet 数据来源:互联网公开数据 标签:故事文本,数据集,自然语言处理,文本分析,机器学习,文本生成,数据分析,语言模型 数据概述: 该数据集包含来自多个来源的组合故事文本数据,记录了各类故事文本的内容和结构。主要特征如下:... -
大型语言模型生成文本检测竞赛用文集-2023年-phanisrikanth
大型语言模型生成文本检测竞赛用文集-2023年-phanisrikanth 数据来源:互联网公开数据 标签:LLM,文本生成,人工智能检测,竞赛数据,英特尔,神经网络,生成文本,论文集 数据概述: 本数据集包含3500篇由大型语言模型(LLM)生成的论文,这些论文是为“Detect AI Generated Text... -
性别中立与包容性文本数据集-pravinkalse
性别中立与包容性文本数据集-pravinkalse 数据来源:互联网公开数据 标签:性别中立,包容性,文本分析,自然语言处理,社会科学,语言模型,数据集,文本生成 数据概述: 该数据集包含来自互联网的文本数据,旨在促进对性别中立和包容性语言的研究与应用。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的文本。... -
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98
大规模语言模型开源项目LMSYS的快速版LLaMA数据集LMSYSOpen-sourceFastLLaMADataset-rushali98 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,LLaMA,开源,文本生成,机器学习,预训练 数据概述:... -
随机诗歌数据集RandomPoemsDataset-garried
随机诗歌数据集RandomPoemsDataset-garried 数据来源:互联网公开数据 标签:诗歌,文学,自然语言处理,文本分析,数据集,文化研究,机器学习,文本生成 数据概述: 该数据集包含来自公开诗歌资源的随机诗歌数据,记录了不同风格和主题的诗歌作品。主要特征如下: 时间跨度:数据记录的时间范围从古代到现代,包含不同历史时期的诗歌作品。... -
Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham
Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,文本生成,语言模型,深度学习,数据增强 数据概述: 该数据集由Mistral模型生成,包含大量文本数据,适用于自然语言处理和机器学习任务。主要特征如下:... -
法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo
法语文本转俚语翻译训练数据集-Gemma模型微调-KAIra-2024-optimo 数据来源:互联网公开数据 标签:法语,俚语,翻译,自然语言处理,LLM,Gemma,模型训练,文本数据,语言学,KAIra,文本生成 数据概述:... -
巴马腊法语平行语料库数据集-ozaresearch1
巴马腊法语平行语料库数据集-ozaresearch1 数据来源:互联网公开数据 标签:巴马腊,法语,平行语料库,机器学习,翻译,文本生成,语言分析 数据概述:... -
虚假情感分析训练数据集-2023-caprolal
虚假情感分析训练数据集-2023-caprolal 数据来源:互联网公开数据 标签:情感分析,训练数据,假数据,faker库,数据分析,文本生成 数据概述: 本数据集是使用faker库生成的虚假情感分析训练数据集,包含模拟的文本数据及其对应的情感标签。数据集旨在为情感分析模型的训练提供大量合成的数据,适用于数据分析和机器学习任务。数据集包含以下字段:...