找到730个数据集

标签: 语言模型

过滤结果
  • 文本分类数据集TextClassificationDataset-albellna

    2025年4月24日   

    文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:...
    packageimg
  • Mistral提示数据集MistralPromptDataset-isrswsiser

    2025年4月24日   

    Mistral提示数据集MistralPromptDataset-isrswsiser 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,机器学习,语言模型,文本生成,人工智能,深度学习 数据概述: 该数据集包含来自Mistral项目的提示数据,记录了用于训练和优化语言模型的提示样本。主要特征如下:...
    packageimg
  • 元学习语言模型数据集Meta-LLMsDataset-daqueen

    2025年4月24日   

    元学习语言模型数据集Meta-LLMsDataset-daqueen 数据来源:互联网公开数据 标签:语言模型,元学习,数据集,自然语言处理,机器学习,人工智能,深度学习,文本生成 数据概述:该数据集包含了来自多个来源的文本数据,用于训练和评估元学习语言模型。主要特征如下: 时间跨度:数据记录的时间范围从2018年到2023年。...
    packageimg
  • ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01

    2025年4月24日   

    ChatGPT中文对话数据集ChatGPTChineseDialogueDataset-netuser01 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,文本生成,语言模型,数据挖掘 数据概述: 该数据集包含来自ChatGPT中文对话生成任务的数据,记录了中文自然语言对话的样本。主要特征如下:...
    packageimg
  • 越南视频标题描述分类数据集VietnameseVideoTitleDescriptionClassificationDataset-hiephahoang

    2025年4月24日   

    越南视频标题描述分类数据集VietnameseVideoTitleDescriptionClassificationDataset-hiephahoang 数据来源:互联网公开数据 标签:视频分类,数据集,自然语言处理,机器学习,视频内容分析,语言模型,越南语,文本分类...
    packageimg
  • 数据增强与反向翻译训练数据集AugmentedTrainDataBacktranslationDataset-konradb

    2025年4月24日   

    数据增强与反向翻译训练数据集AugmentedTrainDataBacktranslationDataset-konradb 数据来源:互联网公开数据 标签:数据增强,反向翻译,数据集,自然语言处理,机器学习,文本处理,语言模型,翻译技术 数据概述:...
    packageimg
  • 新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari

    2025年4月24日   

    新闻标题生成数据集NewsDatasetforHeadlineGeneration-rishikeshfulari 数据来源:互联网公开数据 标签:新闻,标题生成,数据集,自然语言处理,文本生成,机器学习,语言模型,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的新闻文章及其对应的标题,旨在为新闻标题生成任务提供数据支持。主要特征如下:...
    packageimg
  • BERT机器学习项目数据集BERTMachineLearningProjectDataset-sohambalkothe01

    2025年4月24日   

    BERT机器学习项目数据集BERTMachineLearningProjectDataset-sohambalkothe01 数据来源:互联网公开数据 标签:自然语言处理,机器学习,BERT模型,文本分类,深度学习,数据集,语言模型,AI应用 数据概述:...
    packageimg
  • 孟加拉语问答数据集BengaliQuestionAnsweringDataset-prantikbanerjee

    2025年4月24日   

    孟加拉语问答数据集BengaliQuestionAnsweringDataset-prantikbanerjee 数据来源:互联网公开数据 标签:自然语言处理,问答系统,孟加拉语,数据集,文本分析,语言模型,机器阅读理解,人工智能 数据概述: 该数据集包含孟加拉语的问答对,旨在促进孟加拉语自然语言处理领域的研究和发展。主要特征如下:...
    packageimg
  • 数据2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin

    2025年4月24日   

    2018阿里巴巴NLP文本相似度数据集AtecNLPSimDataset-chongjiujjin 数据来源:互联网公开数据 标签:自然语言处理,文本相似度,数据集,机器学习,语义分析,人工智能,语言模型,情感分析 数据概述: 该数据集由阿里巴巴提供,专注于自然语言处理中的文本相似度任务。主要特征如下: 时间跨度:数据记录的时间范围为2018年。...
    packageimg
  • 自然语言处理自动补全数据集NLPAutosuggestionDataset-bhuvanavijaya

    2025年4月24日   

    自然语言处理自动补全数据集NLPAutosuggestionDataset-bhuvanavijaya 数据来源:互联网公开数据 标签:自然语言处理,自动补全,数据集,文本分析,机器学习,人工智能,推荐系统,语言模型 数据概述: 该数据集包含来自互联网公开资源的自然语言处理自动补全数据,记录了用户在输入过程中可能的补全建议。主要特征如下:...
    packageimg
  • 多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang

    2025年4月24日   

    多语言机器翻译与模型训练数据集XLMMLM100Dataset-tonghuazhang 数据来源:互联网公开数据 标签:机器翻译,多语言,数据集,自然语言处理,深度学习,语言模型,文本生成,人工智能 数据概述: 该数据集包含来自多种语言的数据,记录了用于机器翻译和语言模型训练的文本数据。主要特征如下:...
    packageimg
  • 句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista

    2025年4月24日   

    句子类别分类数据集Kategori-KalimatSentenceClassificationDataset-brigitashoreacalista 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,语言模型,数据分析,人工智能,教育技术 数据概述:...
    packageimg
  • 法语智能助手训练数据集FinaleAIFrenchDataset-waelfezari

    2025年4月24日   

    法语智能助手训练数据集FinaleAIFrenchDataset-waelfezari 数据来源:互联网公开数据 标签:自然语言处理,人工智能,数据集,机器学习,语言模型,多语言,教育技术,智能助手 数据概述: 该数据集包含用于训练法语智能助手的多语言对话数据,记录了用户与AI助手之间的交互内容。主要特征如下:...
    packageimg
  • Fast-ai自然语言处理第八章数据集-wabinab

    2025年4月24日   

    Fast-ai自然语言处理第八章数据集-wabinab 数据来源:互联网公开数据 标签:自然语言处理,NLP,fastai,数据集,文本分类,情感分析,语言模型,深度学习 数据概述: 该数据集来源于fast.ai的自然语言处理课程第八章,主要用于教学和实践,涵盖了文本分类和语言模型等任务。主要特征如下:...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-chiraayupravin

    2025年4月24日   

    自然语言处理项目数据集NLPProjectDataset-chiraayupravin 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,数据挖掘,文本分类 数据概述: 该数据集为自然语言处理项目的一部分,主要记录了用于文本分析,语言模型训练等任务的数据。主要特征如下:...
    packageimg
  • 自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg

    2025年4月24日   

    自然语言处理与Python编程结合数据集NLPwithSpaCyandPythonDataset-flaviagg 数据来源:互联网公开数据 标签:自然语言处理,SpaCy,Python编程,数据集,文本分析,机器学习,语言模型,计算语言学 数据概述:...
    packageimg
  • Spacy自然语言处理研究数据集-dsfelix

    2025年4月24日   

    Spacy自然语言处理研究数据集-dsfelix 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,Spacy,语言模型,文本标注,机器学习,NLP 数据概述: 该数据集包含了用于Spacy自然语言处理研究的多个数据集,涵盖了广泛的NLP任务。主要特征如下: 时间跨度:...
    packageimg
  • 大规模语言模型数据LLMData数据集-snehapriyaamp

    2025年4月24日   

    大规模语言模型数据LLMData数据集-snehapriyaamp 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,数据集,文本数据,机器学习,预训练,语言模型,数据清洗 数据概述: 该数据集包含用于训练和评估大规模语言模型(LLM)的文本数据,涵盖多种来源和语言。主要特征如下:...
    packageimg
  • 阿帕卡清洗数据集Bhojpuri语音数据-satyamtiwarii

    2025年4月24日   

    阿帕卡清洗数据集Bhojpuri语音数据-satyamtiwarii 数据来源:互联网公开数据 标签:语音数据,自然语言处理,机器学习,数据集,语言模型,语音识别,人工智能,语言技术 数据概述: 该数据集包含来自阿帕卡(Alpaca)项目清洗后的语音数据,记录了比哈尔普尔语(Bhojpuri)的语音样本和对应的文本内容。主要特征如下:...
    packageimg