数据集 - 海数据

英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk

2025年4月25日

英语聊天机器人对话数据集EnglishChatbotDialogueDataset-nezahatkk 数据来源：互联网公开数据标签：聊天机器人，对话数据，自然语言处理，数据集，文本分析，机器学习，语言模型，人工智能数据概述：该数据集包含了英语聊天机器人生成的对话数据，记录了用户与聊天机器人之间的交互内容。主要特征如下：...

ZIP

大型语言模型性能评测数据集MegformerMainDataset-sinamoradi

2025年4月25日

大型语言模型性能评测数据集MegformerMainDataset-sinamoradi 数据来源：互联网公开数据标签：自然语言处理，语言模型，数据集，模型评测，机器学习，深度学习，AI评估，技术优化数据概述：该数据集包含来自Megformer项目的测试数据，专门用于评估大型语言模型的性能。主要特征如下：...

ZIP

GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr

2025年4月25日

GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，文本生成，语言模型，人工智能，深度学习，文本分析数据概述：该数据集包含了由GPT4再生成的语言模型数据，适用于自然语言处理，文本生成等任务。主要特征如下：...

ZIP

通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi

2025年4月25日

通用文本摘要生成测试数据集CommonLitSummaryDummyDataDataset-shinomoriaoshi 数据来源：互联网公开数据标签：文本摘要，自然语言处理，数据集，机器学习，文本生成，语言模型，人工智能，教育技术数据概述：该数据集包含用于文本摘要生成任务的通用测试数据，记录了多个文本及其对应的摘要信息。主要特征如下：...

ZIP

文本生成预测数据集NextWordGenerateDataset-anirudhasutar

2025年4月25日

文本生成预测数据集NextWordGenerateDataset-anirudhasutar 数据来源：互联网公开数据标签：文本生成，数据集，自然语言处理，机器学习，人工智能，语言模型，文本预测，深度学习数据概述：该数据集包含用于文本生成预测的数据，记录了大量文本数据以训练和评估语言模型。主要特征如下：...

ZIP

数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun

2025年4月25日

数据集与分词器工具集DatasetandTokenizerToolkit-sopanhariemsoeun 数据来源：互联网公开数据标签：自然语言处理，数据集，分词器，文本处理，机器学习，语言模型，数据预处理，工具集数据概述：该数据集包含用于自然语言处理的多种工具和数据集，主要支持文本分词，数据预处理等任务。主要特征如下：...

ZIP

基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg

2025年4月25日

基于翻译的文本释义数据集Paraphrase-Through-TranslationData-terrychanorg 数据来源：互联网公开数据标签：文本释义，机器翻译，数据集，自然语言处理，语义分析，多语言，语言模型，深度学习数据概述：该数据集包含了通过机器翻译生成的文本释义数据，主要用于训练和评估文本释义模型。主要特征如下：时间跨度：...

ZIP

ArgRewritev2语料库数据集-nghtctrl

2025年4月25日

ArgRewritev2语料库数据集-nghtctrl 数据来源：互联网公开数据标签：自然语言处理，语料库，文本生成，机器翻译，文本重写，数据集，语言模型，文本分析数据概述：该数据集包含 ArgRewrite v2 语料库的数据，记录了文本重写任务的多种变体。主要特征如下：时间跨度：数据记录的时间范围为数据集构建和发布时间。...

ZIP

GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12

2025年4月25日

GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，语言模型，文本生成，深度学习，人工智能，模型微调数据概述：该数据集包含用于微调GPT-2语言模型的数据，主要记录了文本数据及其相关的标注信息。主要特征如下：...

ZIP

自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound

2025年4月25日

自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，人工智能，语言模型，文本分类，情感分析数据概述：该数据集用于自然语言处理的入门学习和研究，记录了多种文本数据及相应的标注信息。主要特征如下：...

ZIP

自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01

2025年4月25日

自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源：互联网公开数据标签：自然语言处理，新闻标题，文本分析，机器学习，情感分析，文本摘要，数据集，语言模型数据概述：该数据集包含来自多个新闻来源的新闻标题数据，主要用于自然语言处理（NLP）相关的研究和应用。主要特征如下：...

ZIP

策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020

2025年4月25日

策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020 数据来源：互联网公开数据标签：策略问答，数据集，自然语言处理，机器学习，语言模型，训练数据，问答系统，人工智能数据概述：该数据集包含来自StrategyQA项目的训练数据，用于策略问答系统的训练。主要特征如下：...

ZIP

大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan

2025年4月25日

大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，深度学习，人工智能，语言模型，文本数据，模型训练数据概述：该数据集包含用于训练大型语言模型的原始文本数据，记录了多种来源的文本内容。主要特征如下：...

ZIP

学术论文文本分析数据集EssayDataset-hienbm02

2025年4月25日

学术论文文本分析数据集EssayDataset-hienbm02 数据来源：互联网公开数据标签：文本分析，教育研究，数据集，自然语言处理，机器学习，学术写作，文献分析，语言模型数据概述：该数据集包含来自学术论文和学术写作的文本数据，记录了学术文献的文本内容和相关特征。主要特征如下：时间跨度：数据记录的时间范围从2000年到2022年。...

ZIP

生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi

2025年4月25日

生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源：互联网公开数据标签：自然语言处理，生成式AI，数据集，机器学习，语言模型，文本生成，深度学习，人工智能数据概述：该数据集包含来自生成式预训练模型与大型语言模型（LLM）的研究数据，记录了模型在文本生成，语言理解等方面的表现。主要特征如下：...

ZIP

语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv

2025年4月25日

语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv 数据来源：互联网公开数据标签：自然语言处理，数据集，机器学习，教育，学生，语言模型，平等化，文本分析...

ZIP

GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri

2025年4月25日

GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源：互联网公开数据标签：自然语言处理，数据集，印尼语，GPT-2，文本生成，语言模型，机器翻译，文本分析数据概述：该数据集包含了印尼语文本数据，旨在用于训练和评估GPT-2模型，从而提升印尼语文本生成，翻译等相关任务的性能。主要特征如下：...

ZIP

BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13

2025年4月25日

BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源：互联网公开数据标签：自然语言处理，预训练模型，BERT，机器学习，深度学习，文本分析，语言模型，人工智能数据概述：该数据集包含了BERT-...

ZIP

多选题与文本上下文数据集-hark99

2025年4月25日

多选题与文本上下文数据集-hark99 数据来源：互联网公开数据标签：多选题，上下文理解，自然语言处理，数据集，文本分析，机器学习，考试，语言模型数据概述：该数据集包含多选题及其对应的文本上下文，旨在用于研究和评估模型在理解文本和回答选择题方面的能力。主要特征如下：时间跨度：数据收集的时间范围不限。...

ZIP

生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602

2025年4月25日

生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源：互联网公开数据标签：文本生成，自然语言处理，数据集，机器学习，文本分析，人工智能，语言模型，文本挖掘数据概述：该数据集包含来自多个公开源文本生成的数据，记录了不同场景下的文本内容和特征。主要特征如下：...

ZIP

找到744个数据集

注册成功！