找到646个数据集

标签: 文本生成

过滤结果
  • 经济学论文问答训练数据集EconomicsEssayQ-ATrainingSet-leekahhow

    2025年4月29日   

    经济学论文问答训练数据集EconomicsEssayQ-ATrainingSet-leekahhow 数据来源:互联网公开数据 标签:经济学, 问答, 论文, 训练集, 自然语言处理, 文本生成, 机器学习, 经济学原理 数据概述: 该数据集包含经济学论文相关的问答对,记录了问题(prompt)和对应的答案(completion)文本。主要特征如下:...
    packageimg
  • 文本生成指令数据集TextGenerationInstructions-dmitriyab

    2025年4月29日   

    文本生成指令数据集TextGenerationInstructions-dmitriyab 数据来源:互联网公开数据 标签:文本生成, 指令, 自然语言处理, 文本转换, 语言模型, 数据集, 创作, 语料库 数据概述: 该数据集包含用于文本生成的指令示例,记录了不同类型的文本生成任务。主要特征如下:...
    packageimg
  • 图像描述生成Flickr30K数据集ImageCaptioningFlickr30KCaptions-dujejdjd

    2025年4月29日   

    图像描述生成Flickr30K数据集ImageCaptioningFlickr30KCaptions-dujejdjd 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像标注, 文本生成, 多模态, 数据集, 深度学习 数据概述:...
    packageimg
  • 孟加拉语图像描述数据集BengaliImageCaptionDataset-soumapriyomondal

    2025年4月29日   

    孟加拉语图像描述数据集BengaliImageCaptionDataset-soumapriyomondal 数据来源:互联网公开数据 标签:图像描述, 孟加拉语, 自然语言处理, 计算机视觉, 图像标注, 文本生成, 多模态学习, 数据集 数据概述: 该数据集包含孟加拉语图像描述,记录了与图像相关的孟加拉语文本描述。主要特征如下:...
    packageimg
  • 大语言模型生成文本评估数据集LargeLanguageModelGeneratedTextEvaluationDataset-liziyifromjlu

    2025年4月29日   

    大语言模型生成文本评估数据集LargeLanguageModelGeneratedTextEvaluationDataset-liziyifromjlu 数据来源:互联网公开数据 标签:大语言模型, 文本生成, 评估, 文本质量, 误导性, 事实性, 对抗样本, 模型鲁棒性 数据概述:...
    packageimg
  • 心理健康对话上下文数据集MentalHealthConversationContext-Response-poornimamarini

    2025年4月29日   

    心理健康对话上下文数据集MentalHealthConversationContext-Response-poornimamarini 数据来源:互联网公开数据 标签:心理健康, 对话分析, 情感分析, 文本生成, 自然语言处理, 情绪识别, 问答系统, 语料库 数据概述:...
    packageimg
  • 通用问答系统对话数据集GeneralQuestionAnsweringDialogueDataset-lolqwyt

    2025年4月29日   

    通用问答系统对话数据集GeneralQuestionAnsweringDialogueDataset-lolqwyt 数据来源:互联网公开数据 标签:问答系统, 对话, 自然语言处理, 文本生成, 语料库, 机器学习, 对话理解, 知识检索 数据概述: 该数据集包含来自互联网的问答对话数据,记录了用户提出的问题以及系统的回答。主要特征如下:...
    packageimg
  • 新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14

    2025年4月29日   

    新闻摘要生成验证数据集NewsSummarizationValidationDataset-osamamahmoud14 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 文本生成, 机器翻译, 文本摘要, 验证数据集, 深度学习, 语料库 数据概述:...
    packageimg
  • 餐厅推荐对话数据集RestaurantRecommendationDialogueDataset-sushii2512

    2025年4月29日   

    餐厅推荐对话数据集RestaurantRecommendationDialogueDataset-sushii2512 数据来源:互联网公开数据 标签:对话系统, 餐厅推荐, 自然语言处理, 意图识别, 槽位填充, 对话管理, 文本生成, 数据集 数据概述: 该数据集包含餐厅推荐对话数据,记录了用户与对话系统之间关于餐厅信息的交互过程。主要特征如下:...
    packageimg
  • AI竞赛DAIGT文本生成检测数据集

    2025年4月27日   

    AI竞赛DAIGT文本生成检测数据集 数据来源:互联网公开数据 标签:文本生成, AI检测, 竞赛数据, 自然语言处理, 逆向工程, 替换映射, 文本匹配 数据概述:...
    packageimg
  • 新闻摘要生成数据集XSumCSVDataset-sidop21

    2025年4月26日   

    新闻摘要生成数据集XSumCSVDataset-sidop21 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,机器学习,新闻分析,文本生成,数据挖掘,信息提取 数据概述: 该数据集源自XSum项目,专注于新闻文章的摘要生成任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,具体时间信息未提供。...
    packageimg
  • 语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500

    2025年4月26日   

    语言模型生成文本数据集Alpaca-FLANOutputsDataset-varun500 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,语言模型,机器学习,人工智能,机器翻译,对话系统 数据概述: 该数据集包含来自Alpaca和FLAN语言模型的生成文本数据,记录了语言模型在多种任务中的文本生成结果。主要特征如下:...
    packageimg
  • 大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks

    2025年4月26日   

    大规模语言模型微调数据集Fine-tuningNewDataset-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,微调,文本生成,机器翻译,问答系统,深度学习 数据概述: 该数据集包含用于微调大规模语言模型的数据,涵盖了多种自然语言处理任务。主要特征如下:...
    packageimg
  • 问答系统评估数据集Qwen-AnswersDataset-martintura

    2025年4月26日   

    问答系统评估数据集Qwen-AnswersDataset-martintura 数据来源:互联网公开数据 标签:自然语言处理,问答系统,数据集,机器学习,人工智能,知识图谱,信息检索,文本生成 数据概述: 该数据集包含来自问答系统Qwen的问答对数据,记录了用户提出的问题和系统生成的答案。主要特征如下:...
    packageimg
  • Quora语句改写数据集QuoraParaphrasingDataset-fbgame123

    2025年4月26日   

    Quora语句改写数据集QuoraParaphrasingDataset-fbgame123 数据来源:互联网公开数据 标签:自然语言处理,文本改写,数据集,机器学习,语义相似度,语言模型,文本生成,人工智能 数据概述: 该数据集来源于Quora平台,包含了用户提问的原始语句及对应的改写版本,用于研究语句改写和语义相似度分析。主要特征如下:...
    packageimg
  • 测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj

    2025年4月26日   

    测试MisralLLaMA与ChatGPT差异数据集TestMisralLLaMAChatGPTDifferSet-alexeyj 数据来源:互联网公开数据 标签:对话系统,语言模型,数据集,自然语言处理,机器学习,人工智能,文本生成,比较分析 数据概述: 该数据集包含了Misral...
    packageimg
  • 合成心理健康对话数据集-denisemtatih

    2025年4月26日   

    合成心理健康对话数据集-denisemtatih 数据来源:互联网公开数据 标签:心理健康,对话,数据集,自然语言处理,情感分析,文本生成,机器学习,人机交互 数据概述: 该数据集包含合成的心理健康对话记录,旨在模拟患者与治疗师或支持性人工智能之间的交流。主要特征如下: 时间跨度:数据记录未明确时间跨度,主要关注对话内容和情感表达。...
    packageimg
  • 贝叶斯方法微调大型语言模型数据集LLM-finetuningBayesianDataset-tylerchun91

    2025年4月26日   

    贝叶斯方法微调大型语言模型数据集LLM-finetuningBayesianDataset-tylerchun91 数据来源:互联网公开数据 标签:大型语言模型,贝叶斯方法,微调,数据集,自然语言处理,机器学习,模型优化,文本生成 数据概述: 该数据集包含用于贝叶斯方法微调大型语言模型的数据,旨在提升模型性能和泛化能力。主要特征如下:...
    packageimg
  • 生成式数据集2000年GenerateDF2000-mandrilator

    2025年4月26日   

    生成式数据集2000年GenerateDF2000-mandrilator 数据来源:互联网公开数据 标签:生成数据,数据集,机器学习,自然语言处理,文本生成,人工智能,数据科学,语言模型 数据概述:该数据集包含来自互联网的多样化文本数据,主要记录了2000年期间的文本信息,适用于生成式模型的训练和文本生成任务。主要特征如下:...
    packageimg
  • EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92

    2025年4月26日   

    EEDI预训练混合数据集EEDIEmbedPretrainMixFinalDataset-conjuring92 数据来源:互联网公开数据 标签:自然语言处理,预训练,数据集,文本嵌入,深度学习,语言模型,机器翻译,文本生成 数据概述: 该数据集是EEDI项目用于预训练的最终混合数据集,包含了多种来源的文本数据,旨在提升语言模型的性能。主要特征如下:...
    packageimg