数据集 - 海数据

大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen

2025年4月23日

大规模语言模型上下文理解数据集LargeLanguageModelContextUnderstandingDataset-yingpengchen 数据来源：互联网公开数据标签：自然语言处理，数据集，语言模型，上下文理解，文本分析，机器学习，人工智能，语义分析数据概述：...

ZIP

常识评估数据集CommonSenseEvaluationData-hassam361

2025年4月23日

常识评估数据集CommonSenseEvaluationData-hassam361 数据来源：互联网公开数据标签：常识推理，自然语言处理，数据集，文本理解，人工智能，语义分析，知识图谱，语言模型数据概述：该数据集包含用于评估常识推理能力的数据，旨在测试模型在理解和应用常识方面的表现。主要特征如下：...

ZIP

自然语言处理示例数据集NLPSampleData-fishercht

2025年4月23日

自然语言处理示例数据集NLPSampleData-fishercht 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，文本挖掘，语言模型，情感分析，语料库数据概述：该数据集包含多种用于自然语言处理任务的示例数据，旨在帮助研究人员和开发者进行算法测试和模型训练。主要特征如下：...

ZIP

性别中立与包容性文本数据集-pravinkalse

2025年4月23日

性别中立与包容性文本数据集-pravinkalse 数据来源：互联网公开数据标签：性别中立，包容性，文本分析，自然语言处理，社会科学，语言模型，数据集，文本生成数据概述：该数据集包含来自互联网的文本数据，旨在促进对性别中立和包容性语言的研究与应用。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了不同时期和来源的文本。...

ZIP

问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat

2025年4月23日

问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，机器学习，命令识别，问题分析，语言模型，智能问答数据概述：...

ZIP

语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak

2025年4月23日

语义文本相关性数据集SemanticTextualRelatednessData-udvasbasak 数据来源：互联网公开数据标签：文本分析，语义理解，自然语言处理，机器学习，信息检索，人工智能，语言模型，数据挖掘数据概述：该数据集包含来自公开资源的数据，记录了用于衡量文本间语义相关性的文本对。主要特征如下：...

ZIP

CommonLit阅读理解文本摘要数据集-shinomoriaoshi

2025年4月23日

CommonLit阅读理解文本摘要数据集-shinomoriaoshi 数据来源：互联网公开数据标签：阅读理解，文本摘要，自然语言处理，机器学习，教育，数据集，文本分析，语言模型数据概述：该数据集包含来自CommonLit网站的阅读理解文章及其对应的文本摘要。主要特征如下：...

ZIP

对话摘要生成数据集DialogSummarizationDataset-sukalp1899

2025年4月23日

对话摘要生成数据集DialogSummarizationDataset-sukalp1899 数据来源：互联网公开数据标签：对话摘要，数据集，自然语言处理，机器学习，文本分析，人工智能，语言模型，对话系统数据概述：该数据集包含来自多个来源的对话记录及其对应的摘要，适用于对话摘要生成任务。主要特征如下：...

ZIP

BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad

2025年4月23日

BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源：互联网公开数据标签：自然语言处理，机器学习，数据集，文本分析，深度学习，语言模型，AI研究，文本分类数据概述：该数据集包含通过BERT模型处理后的文本数据结果，记录了BERT模型对输入文本的分析和处理输出。主要特征如下：...

ZIP

PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips

2025年4月23日

PromptEnhanceArchive数据集PromptEnhanceArchiveDataset-overtimecraftsclips 数据来源：互联网公开数据标签：自然语言处理，文本增强，数据集，机器学习，深度学习，文本挖掘，语言模型，信息检索数据概述：...

ZIP

GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek

2025年4月23日

GPT-3模型性能评估数据集GPT-3ModelPerformanceEvaluationDataset-utsavshek 数据来源：互联网公开数据标签：自然语言处理，人工智能，数据集，机器学习，模型评估，语言模型，深度学习，算法研究数据概述：...

ZIP

Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham

2025年4月23日

Mistral生成数据集Mistral-GeneratedDataDataset-hajarhisham 数据来源：互联网公开数据标签：人工智能，自然语言处理，数据集，机器学习，文本生成，语言模型，深度学习，数据增强数据概述：该数据集由Mistral模型生成，包含大量文本数据，适用于自然语言处理和机器学习任务。主要特征如下：...

ZIP

聊天机器人交互数据数据集ChatbotInteractionDataDataset-phmanhth

2025年4月23日

聊天机器人交互数据数据集ChatbotInteractionDataDataset-phmanhth 数据来源：互联网公开数据标签：聊天机器人，交互数据，数据集，自然语言处理，人工智能，机器学习，语言模型，对话系统数据概述：该数据集包含来自多个聊天机器人的交互数据，记录了用户与机器人之间的对话内容。主要特征如下：...

ZIP

深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1

2025年4月23日

深度学习训练语言模型数据集Dev-TrainLLMDataset-ahmedgongi1 数据来源：互联网公开数据标签：深度学习，语言模型，数据集，自然语言处理，机器学习，人工智能，文本分析，数据挖掘数据概述：该数据集包含用于训练和开发语言模型的数据，主要面向深度学习领域的模型训练和评估。主要特征如下：...

ZIP

大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo

2025年4月23日

大型语言模型提示恢复竞赛生成的文本数据集-juanmerinobermejo 数据来源：互联网公开数据标签：LLM,提示恢复,自然语言处理,文本重写,上下文理解,数据集,语言模型数据概述：本数据集包含来自LLM提示恢复竞赛的丰富文本数据，每个条目包括原始文本、使用的提示、简化的提示以及AI生成的重写文本。该数据集揭示了Gemma...

ZIP

预训练模型数据集

2025年4月23日

预训练模型数据集数据来源：互联网公开数据标签：预训练模型,自然语言处理,深度学习,模型训练,人工智能,模型架构,训练数据,性能评估,语言模型数据概述：...

ZIP

法语语法纠错数据集JFLEGFrenchGrammarCorrectionDataset-turiabu

2025年4月23日

法语语法纠错数据集JFLEGFrenchGrammarCorrectionDataset-turiabu 数据来源：互联网公开数据标签：语法纠错，自然语言处理，数据集，机器学习，语言模型，文本处理，法语，人工智能数据概述：该数据集包含来自JFLEG项目（JFLEG French Grammar...

ZIP

大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001

2025年4月23日

大型语言模型多任务理解能力评估数据集MMLU-LLM-Science竞赛适配-peiyuanliu2001 数据来源：互联网公开数据标签：MMLU,多学科,选择题,语言模型,评估,LLM_Science,竞赛,人工智能,NLP 数据概述：本数据集源自MMLU（Massive Multitask Language...

ZIP

自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks

2025年4月23日

自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks 数据来源：互联网公开数据标签：自然语言处理，微调，文本分类，数据集，机器学习，深度学习，语言模型，模型优化...

ZIP

葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing

2025年4月23日

葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，语言模型，机器学习，多语言，文本分析，语言学数据概述：该数据集包含来自葡萄牙语互联网的文本数据，专门用于葡萄牙语的文本分类任务。主要特征如下：...

ZIP

找到744个数据集

注册成功！