找到755个数据集

标签: 语言模型

过滤结果
  • 语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv

    2025年4月25日   

    语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,教育,学生,语言模型,平等化,文本分析...
    packageimg
  • GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

    2025年4月25日   

    GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:...
    packageimg
  • BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13

    2025年4月25日   

    BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-...
    packageimg
  • 多选题与文本上下文数据集-hark99

    2025年4月25日   

    多选题与文本上下文数据集-hark99 数据来源:互联网公开数据 标签:多选题,上下文理解,自然语言处理,数据集,文本分析,机器学习,考试,语言模型 数据概述:该数据集包含多选题及其对应的文本上下文,旨在用于研究和评估模型在理解文本和回答选择题方面的能力。主要特征如下: 时间跨度:数据收集的时间范围不限。...
    packageimg
  • 生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

    2025年4月25日   

    生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:...
    packageimg
  • DACON语言翻译输出数据集-geying

    2025年4月25日   

    DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。...
    packageimg
  • HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74

    2025年4月25日   

    HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face...
    packageimg
  • 机器翻译硕士论文数据集MachineTranslationMaster-sThesisDataset-fathanalhindami

    2025年4月25日   

    机器翻译硕士论文数据集MachineTranslationMaster-sThesisDataset-fathanalhindami 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,学术研究,文本翻译,语言模型,人工智能,教育研究 数据概述:...
    packageimg
  • 单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1

    2025年4月25日   

    单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1 数据来源:互联网公开数据 标签:自然语言处理,词频统计,数据集,文本分析,机器学习,语言模型,统计学,数据挖掘 数据概述: 该数据集包含来自多种文本来源的单字词频统计信息,记录了不同语言或文本中单个字的出现频率。主要特征如下:...
    packageimg
  • 数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber

    2025年4月25日   

    2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:...
    packageimg
  • 印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki

    2025年4月24日   

    印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:...
    packageimg
  • 推断语义模型训练与检测数据集InferSentTrain-DetectV2Dataset-dm4006

    2025年4月24日   

    推断语义模型训练与检测数据集InferSentTrain-DetectV2Dataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,语义理解,数据集,深度学习,文本分类,情感分析,机器学习,语言模型 数据概述: 该数据集专为训练和检测推断语义模型(InferSent)而设计,记录了用于语义理解和推断的文本数据。主要特征如下:...
    packageimg
  • LLM文本检测数据集-wcylxh

    2025年4月24日   

    LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。...
    packageimg
  • 文本生成模型Gemma数据集-minhsienweng

    2025年4月24日   

    文本生成模型Gemma数据集-minhsienweng 数据来源:互联网公开数据 标签:文本生成,机器学习,自然语言处理,数据集,人工智能,语言模型,深度学习,文本分析...
    packageimg
  • 通义千问问答结果数据集Qwen-QAResultsDataset-bartamin

    2025年4月24日   

    通义千问问答结果数据集Qwen-QAResultsDataset-bartamin 数据来源:互联网公开数据 标签:问答,自然语言处理,数据集,文本生成,模型评估,机器学习,人工智能,语言模型 数据概述: 该数据集包含了通义千问(Qwen)大语言模型的问答结果,记录了模型对不同问题的回答。主要特征如下: 时间跨度:数据记录的时间范围为发布时间。...
    packageimg
  • CommonLit阅读理解测评数据集-jackson786

    2025年4月24日   

    CommonLit阅读理解测评数据集-jackson786 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,文本分析,教育,数据集,机器学习,文本分类,语言模型 数据概述: 该数据集包含CommonLit公司的阅读理解测评数据,记录了学生在阅读不同文本后的理解能力评估结果。主要特征如下:...
    packageimg
  • 语言模型检测训练与测试数据集LLM检测训练测试数据集-johnsonl8

    2025年4月24日   

    语言模型检测训练与测试数据集LLM检测训练测试数据集-johnsonl8 数据来源:互联网公开数据 标签:语言模型,检测,数据集,训练,测试,自然语言处理,机器学习,安全技术 数据概述:该数据集包含用于语言模型检测的训练和测试数据,记录了不同类型文本的特征和标签,适用于语言模型的检测和评估任务。主要特征如下:...
    packageimg
  • 自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor

    2025年4月24日   

    自然语言处理文本到文本转换数据集NLPText2TextDataset-manchvictor 数据来源:互联网公开数据 标签:自然语言处理,文本到文本,数据集,机器学习,深度学习,语言模型,翻译,文本生成 数据概述: 该数据集包含自然语言处理中的文本到文本转换任务数据,记录了输入文本和对应的输出文本。主要特征如下: 时间跨度:...
    packageimg
  • 阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21

    2025年4月24日   

    阿拉伯语与英语代码切换数据集ArabicandEnglishCode-SwitchingDataset-mahmoudosama21 数据来源:互联网公开数据 标签:语言学研究,代码切换,数据集,自然语言处理,双语处理,机器学习,文本分析,语言模型 数据概述:...
    packageimg
  • 元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata

    2025年4月24日   

    元数据语料库聚合数据集MetaCorpusAggregateDataset-jpmusdata 数据来源:互联网公开数据 标签:数据集,自然语言处理,文本分析,机器学习,信息检索,数据挖掘,语料库,语言模型 数据概述: 该数据集包含来自多个来源的语料库数据,记录了不同领域的文本信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg