找到67个数据集

标签: LLM

过滤结果
  • 比特币推文情感分析数据集

    2025年4月14日   

    比特币推文情感分析数据集 数据来源:互联网公开数据 标签:比特币,推文,情感分析,自然语言处理,机器学习,LLM,数据清洗 数据概述:...
    packageimg
  • 科学考试LLM重译训练数据集

    2025年4月14日   

    科学考试LLM重译训练数据集 数据来源:互联网公开数据 标签:科学考试,LLM,数据增强,重译,日语翻译,数据集 数据概述:...
    packageimg
  • LLM20问题解决方案关键词频率数据集

    2025年4月14日   

    LLM20问题解决方案关键词频率数据集 数据来源:互联网公开数据 标签:LLM,20问题解决方案,关键词频率,自然语言处理,机器学习,数据分析 数据概述: 本数据集包含用于解决LLM(大语言模型)20个问题的过滤后关键词列表及其出现频率。数据涵盖了与20个问题相关的常用关键词及其在解决方案中的使用频率,为研究和开发提供了宝贵的语言模型训练资源。...
    packageimg
  • LLM说服性生成文章数据集

    2025年4月14日   

    LLM说服性生成文章数据集 数据来源:互联网公开数据 标签:LLM,生成文章,GPT-4,Bard,Llama-2-7B,Mixtral,文本生成,人工智能,写作风格分析 数据概述:...
    packageimg
  • LLM提示恢复合成数据集

    2025年4月14日   

    LLM提示恢复合成数据集 数据来源:互联网公开数据 标签:LLM,提示恢复,合成数据,自然语言处理,人工智能,机器学习,数据竞赛 数据概述: 本数据集使用Gemma 7B-IT生成了1000个示例,用于LLM提示恢复竞赛。数据集基于@thedrcat的原始数据集进行扩展,包含两个额外的列:一是Gemma 7B-IT生成的原始输出,二是去除“Sure…...
    packageimg
  • 使用 peft 和 lora 进行 LLM 微调的合成数据

    2025年2月14日   

    该数据集包含对话摘要、主题和对话,用于使用参数有效微调和大型语言模型的低秩自适应创建对 LLM 模型进行微调的管道,这是一种流行且轻量级的训练技术,可显着减少可训练参数的数量。 该数据集也可在 hugging face 中使用。https://huggingface.co/datasets/knkarthick/dialogsum
    packageimg
  • 用于 LLM 微调的土耳其农业数据集

    2024年11月9日   

    该数据集旨在微调 T3 AI 土耳其语 LLM。它由 Barathan Aslan、Ömer Faruk Çelik 和 Batuhan Kalem 为 T3 AI Hackathon 创建。该数据集专注于土耳其农业。
    packageimg