找到730个数据集

标签: 语言模型

过滤结果
  • 英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas

    2025年4月23日   

    英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:...
    packageimg
  • 自然语言处理数据集NLP数据集-mkmanoj353

    2025年4月23日   

    自然语言处理数据集NLP数据集-mkmanoj353 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述:该数据集包含来自多个来源的自然语言处理数据,记录了大量文本数据以支持各种NLP任务。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 文本分析工具数据集TextAnalysisToolDataset-jaynadkarni

    2025年4月23日   

    文本分析工具数据集TextAnalysisToolDataset-jaynadkarni 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,语言模型,数据科学 数据概述: 该数据集包含来自多个公开来源的文本数据,记录了各类文本内容的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 孟加拉语维基百科文本数据集

    2025年4月23日   

    孟加拉语维基百科文本数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,文本数据,自然语言处理,机器学习,语言模型,文本挖掘 数据概述:...
    packageimg
  • 大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen

    2025年4月23日   

    大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,数据集,语言模型,上下文理解,文本分析,机器学习,人工智能,语义分析 数据概述:...
    packageimg
  • 常识评估数据集CommonSenseEvaluationData-hassam361

    2025年4月23日   

    常识评估数据集CommonSenseEvaluationData-hassam361 数据来源:互联网公开数据 标签:常识推理,自然语言处理,数据集,文本理解,人工智能,语义分析,知识图谱,语言模型 数据概述: 该数据集包含用于评估常识推理能力的数据,旨在测试模型在理解和应用常识方面的表现。主要特征如下:...
    packageimg
  • 自然语言处理示例数据集NLPSampleData-fishercht

    2025年4月23日   

    自然语言处理示例数据集NLPSampleData-fishercht 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,文本挖掘,语言模型,情感分析,语料库 数据概述: 该数据集包含多种用于自然语言处理任务的示例数据,旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下:...
    packageimg
  • 性别中立与包容性文本数据集-pravinkalse

    2025年4月23日   

    性别中立与包容性文本数据集-pravinkalse 数据来源:互联网公开数据 标签:性别中立,包容性,文本分析,自然语言处理,社会科学,语言模型,数据集,文本生成 数据概述: 该数据集包含来自互联网的文本数据,旨在促进对性别中立和包容性语言的研究与应用。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期和来源的文本。...
    packageimg
  • 问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat

    2025年4月23日   

    问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,命令识别,问题分析,语言模型,智能问答 数据概述:...
    packageimg
  • 语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak

    2025年4月23日   

    语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源:互联网公开数据 标签:文本分析,语义理解,自然语言处理,机器学习,信息检索,人工智能,语言模型,数据挖掘 数据概述: 该数据集包含来自公开资源的数据,记录了用于衡量文本间语义相关性的文本对。主要特征如下:...
    packageimg
  • CommonLit阅读理解文本摘要数据集-shinomoriaoshi

    2025年4月23日   

    CommonLit阅读理解文本摘要数据集-shinomoriaoshi 数据来源:互联网公开数据 标签:阅读理解,文本摘要,自然语言处理,机器学习,教育,数据集,文本分析,语言模型 数据概述:该数据集包含来自CommonLit网站的阅读理解文章及其对应的文本摘要。主要特征如下:...
    packageimg
  • 对话摘要生成数据集DialogSummarizationDataset-sukalp1899

    2025年4月23日   

    对话摘要生成数据集DialogSummarizationDataset-sukalp1899 数据来源:互联网公开数据 标签:对话摘要,数据集,自然语言处理,机器学习,文本分析,人工智能,语言模型,对话系统 数据概述:该数据集包含来自多个来源的对话记录及其对应的摘要,适用于对话摘要生成任务。主要特征如下:...
    packageimg
  • BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad

    2025年4月23日   

    BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分析,深度学习,语言模型,AI研究,文本分类 数据概述:该数据集包含通过BERT模型处理后的文本数据结果,记录了BERT模型对输入文本的分析和处理输出。主要特征如下:...
    packageimg
  • PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips

    2025年4月23日   

    PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips 数据来源:互联网公开数据 标签:自然语言处理,文本增强,数据集,机器学习,深度学习,文本挖掘,语言模型,信息检索 数据概述:...
    packageimg
  • GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek

    2025年4月23日   

    GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,模型评估,语言模型,深度学习,算法研究 数据概述:...
    packageimg
  • Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham

    2025年4月23日   

    Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,文本生成,语言模型,深度学习,数据增强 数据概述: 该数据集由Mistral模型生成,包含大量文本数据,适用于自然语言处理和机器学习任务。主要特征如下:...
    packageimg
  • 聊天机器人交互数据数据集ChatbotInteractionDataDataset-phmanhth

    2025年4月23日   

    聊天机器人交互数据数据集ChatbotInteractionDataDataset-phmanhth 数据来源:互联网公开数据 标签:聊天机器人,交互数据,数据集,自然语言处理,人工智能,机器学习,语言模型,对话系统 数据概述:该数据集包含来自多个聊天机器人的交互数据,记录了用户与机器人之间的对话内容。主要特征如下:...
    packageimg
  • 深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1

    2025年4月23日   

    深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1 数据来源:互联网公开数据 标签:深度学习,语言模型,数据集,自然语言处理,机器学习,人工智能,文本分析,数据挖掘 数据概述: 该数据集包含用于训练和开发语言模型的数据,主要面向深度学习领域的模型训练和评估。主要特征如下:...
    packageimg
  • 大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo

    2025年4月23日   

    大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo 数据来源:互联网公开数据 标签:LLM,提示恢复,自然语言处理,文本重写,上下文理解,数据集,语言模型 数据概述: 本数据集包含来自LLM提示恢复竞赛的丰富文本数据,每个条目包括原始文本、使用的提示、简化的提示以及AI生成的重写文本。该数据集揭示了Gemma...
    packageimg
  • Evol-Codealpaca中英指令转换数据集

    2025年4月23日   

    Evol-Codealpaca中英指令转换数据集 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,中英翻译,指令转换,代码生成,语言模型,数据集,Hugging Face 数据概述: 本数据集由Evol-...
    packageimg