找到730个数据集

标签: 语言模型

过滤结果
  • 大型语言模型性能评测数据集MegformerMainDataset-sinamoradi

    2025年4月25日   

    大型语言模型性能评测数据集MegformerMainDataset-sinamoradi 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,模型评测,机器学习,深度学习,AI评估,技术优化 数据概述: 该数据集包含来自Megformer项目的测试数据,专门用于评估大型语言模型的性能。主要特征如下:...
    packageimg
  • GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr

    2025年4月25日   

    GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,深度学习,文本分析 数据概述:该数据集包含了由GPT4再生成的语言模型数据,适用于自然语言处理,文本生成等任务。主要特征如下:...
    packageimg
  • 通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi

    2025年4月25日   

    通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,教育技术 数据概述:该数据集包含用于文本摘要生成任务的通用测试数据,记录了多个文本及其对应的摘要信息。主要特征如下:...
    packageimg
  • 文本生成预测数据集NextWordGenerateDataset-anirudhasutar

    2025年4月25日   

    文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源:互联网公开数据 标签:文本生成,数据集,自然语言处理,机器学习,人工智能,语言模型,文本预测,深度学习 数据概述:该数据集包含用于文本生成预测的数据,记录了大量文本数据以训练和评估语言模型。主要特征如下:...
    packageimg
  • 双子星长文本数据集GeminiLongContextDataset-akinduhiman

    2025年4月25日   

    双子星长文本数据集GeminiLongContextDataset-akinduhiman 数据来源:互联网公开数据 标签:自然语言处理,长文本分析,数据集,机器学习,文本生成,语言模型,学术研究,人工智能 数据概述:该数据集包含来自双子星项目的长文本数据,记录了多种类型的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2022年。...
    packageimg
  • 数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun

    2025年4月25日   

    数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun 数据来源:互联网公开数据 标签:自然语言处理,数据集,分词器,文本处理,机器学习,语言模型,数据预处理,工具集 数据概述: 该数据集包含用于自然语言处理的多种工具和数据集,主要支持文本分词,数据预处理等任务。主要特征如下:...
    packageimg
  • 基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg

    2025年4月25日   

    基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源:互联网公开数据 标签:文本释义,机器翻译,数据集,自然语言处理,语义分析,多语言,语言模型,深度学习 数据概述: 该数据集包含了通过机器翻译生成的文本释义数据,主要用于训练和评估文本释义模型。主要特征如下: 时间跨度:...
    packageimg
  • ArgRewritev2语料库数据集-nghtctrl

    2025年4月25日   

    ArgRewritev2语料库数据集-nghtctrl 数据来源:互联网公开数据 标签:自然语言处理,语料库,文本生成,机器翻译,文本重写,数据集,语言模型,文本分析 数据概述: 该数据集包含 ArgRewrite v2 语料库的数据,记录了文本重写任务的多种变体。主要特征如下: 时间跨度:数据记录的时间范围为数据集构建和发布时间。...
    packageimg
  • GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

    2025年4月25日   

    GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:...
    packageimg
  • 自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound

    2025年4月25日   

    自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述: 该数据集用于自然语言处理的入门学习和研究,记录了多种文本数据及相应的标注信息。主要特征如下:...
    packageimg
  • 自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01

    2025年4月25日   

    自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源:互联网公开数据 标签:自然语言处理,新闻标题,文本分析,机器学习,情感分析,文本摘要,数据集,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻标题数据,主要用于自然语言处理(NLP)相关的研究和应用。主要特征如下:...
    packageimg
  • 策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020

    2025年4月25日   

    策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020 数据来源:互联网公开数据 标签:策略问答,数据集,自然语言处理,机器学习,语言模型,训练数据,问答系统,人工智能 数据概述:该数据集包含来自StrategyQA项目的训练数据,用于策略问答系统的训练。主要特征如下:...
    packageimg
  • 大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan

    2025年4月25日   

    大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:...
    packageimg
  • 学术论文文本分析数据集EssayDataset-hienbm02

    2025年4月25日   

    学术论文文本分析数据集EssayDataset-hienbm02 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,学术写作,文献分析,语言模型 数据概述: 该数据集包含来自学术论文和学术写作的文本数据,记录了学术文献的文本内容和相关特征。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。...
    packageimg
  • 生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi

    2025年4月25日   

    生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源:互联网公开数据 标签:自然语言处理,生成式AI,数据集,机器学习,语言模型,文本生成,深度学习,人工智能 数据概述: 该数据集包含来自生成式预训练模型与大型语言模型(LLM)的研究数据,记录了模型在文本生成,语言理解等方面的表现。主要特征如下:...
    packageimg
  • 语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv

    2025年4月25日   

    语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,教育,学生,语言模型,平等化,文本分析...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg
  • BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13

    2025年4月25日   

    BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-...
    packageimg
  • 多选题与文本上下文数据集-hark99

    2025年4月25日   

    多选题与文本上下文数据集-hark99 数据来源:互联网公开数据 标签:多选题,上下文理解,自然语言处理,数据集,文本分析,机器学习,考试,语言模型 数据概述:该数据集包含多选题及其对应的文本上下文,旨在用于研究和评估模型在理解文本和回答选择题方面的能力。主要特征如下: 时间跨度:数据收集的时间范围不限。...
    packageimg
  • 生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

    2025年4月25日   

    生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:...
    packageimg