找到742个数据集

标签: 语言模型

过滤结果
  • 电影对话文本数据集MovieDialogTextDataset-jaafarhabibi

    2025年4月26日   

    电影对话文本数据集MovieDialogTextDataset-jaafarhabibi 数据来源:互联网公开数据 标签:电影,对话,数据集,自然语言处理,文本分析,人工智能,情感分析,语言模型 数据概述:该数据集包含来自多部电影的对话文本数据,记录了电影中的对话内容及部分相关元信息。主要特征如下:...
    packageimg
  • HuggingFace预训练模型数据集BERT-xenxiou

    2025年4月26日   

    HuggingFace预训练模型数据集BERT-xenxiou 数据来源:互联网公开数据 标签:自然语言处理,数据集,预训练模型,BERT,文本分析,机器学习,语言模型,Transformer 数据概述: 该数据集包含了Hugging Face平台提供的用于预训练BERT模型的数据集。主要特征如下:...
    packageimg
  • 词嵌入训练数据集-akalyasubramanian

    2025年4月26日   

    词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:...
    packageimg
  • 自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss

    2025年4月26日   

    自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,数据集,XLM-R,文本分类,深度学习,机器学习,语言模型 数据概述: 该数据集专注于自然语言处理中的多分类任务,采用了XLM-R(跨语言语言模型)进行文本分类。主要特征如下:...
    packageimg
  • Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari

    2025年4月26日   

    Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本生成,数据集,Qlora,T5模型,OpenOrca,语言模型 数据概述: 该数据集用于训练Qlora-T5模型,整合了OpenOrca数据集。主要特征如下: 时间跨度:...
    packageimg
  • 自然语言处理NLP实践数据集-north151

    2025年4月26日   

    自然语言处理NLP实践数据集-north151 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本数据,机器学习,语言模型,文本分类,情感分析,信息抽取,数据集 数据概述: 该数据集包含用于自然语言处理(NLP)实践的文本数据,主要用于训练和评估NLP模型。主要特征如下: 时间跨度:数据无明确时间范围,涵盖多种文本数据类型。...
    packageimg
  • 自然语言处理文件数据集NLPFilesDataset-germanarley

    2025年4月25日   

    自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,语义分析,文本分类,人工智能 数据概述: 该数据集包含来自多个公开来源的自然语言处理相关文本文件,记录了不同类型的文本数据。主要特征如下:...
    packageimg
  • AST-SQL数据集AST-SQLDataset-youssefhazemfarouk

    2025年4月25日   

    AST-SQL数据集AST-SQLDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:自然语言处理,SQL生成,数据集,机器学习,数据库,文本分析,语言模型,数据查询 数据概述: 该数据集专注于自然语言到SQL的转换任务,记录了如何将自然语言查询语句转换为相应的SQL查询语句。主要特征如下:...
    packageimg
  • 英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa

    2025年4月25日   

    英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:...
    packageimg
  • 英语写作关联特征训练数据集-kentakikuhi

    2025年4月25日   

    英语写作关联特征训练数据集-kentakikuhi 数据来源:互联网公开数据 标签:英语写作,数据集,自然语言处理,文本分析,机器学习,语言模型,写作质量,关联特征 数据概述: 该数据集包含了用于训练英语写作关联特征的数据,旨在提升写作质量和理解写作模式。主要特征如下: 时间跨度:数据没有明确的时间跨度,但通常涵盖现代英语写作。...
    packageimg
  • 社交媒体评论反讽检测数据集DetectSarcasminCommentsDataset-sachinichake

    2025年4月25日   

    社交媒体评论反讽检测数据集DetectSarcasminCommentsDataset-sachinichake 数据来源:互联网公开数据 标签:自然语言处理,情感分析,反讽检测,数据集,机器学习,文本分类,社交媒体,语言模型 数据概述: 该数据集包含来自社交媒体平台的用户评论数据,专注于识别和检测评论中的反讽内容。主要特征如下:...
    packageimg
  • 多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist

    2025年4月25日   

    多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance...
    packageimg
  • 大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

    2025年4月25日   

    大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源:互联网公开数据 标签:语言模型,机器学习,自然语言处理,深度学习,人工智能,文本生成,文本分析,大数据 数据概述: 该数据集包含用于训练大型语言模型(LLM)的文本数据,特别适用于JAX框架下的LLaMA 13B模型。主要特征如下:...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-nikunjphutela

    2025年4月25日   

    自然语言处理项目数据集NLPProjectDataset-nikunjphutela 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,语言模型,数据集,文本分类,情感分析 数据概述: 该数据集为自然语言处理项目专用,记录了多种文本数据及相关标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan

    2025年4月25日   

    超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,机器学习,深度学习,文本分类,语言模型,人工智能,数据集 数据概述: 该数据集包含来自超大规模预训练语言模型 HS-XLNet 的数据,记录了大规模文本语料的预训练过程和结果。主要特征如下:...
    packageimg
  • Commonlit阅读理解文本特征数据集-vaibhavnakrani

    2025年4月25日   

    Commonlit阅读理解文本特征数据集-vaibhavnakrani 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,文本分析,数据集,教育,机器学习,文本特征,语言模型 数据概述: 该数据集包含了Commonlit阅读理解竞赛的文本数据,旨在帮助研究人员和开发者构建更有效的阅读理解模型。主要特征如下:...
    packageimg
  • 学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech

    2025年4月25日   

    学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech 数据来源:互联网公开数据 标签:学生作文,语言模型,数据集,自然语言处理,文本分析,机器学习,学术研究,教育评估 数据概述:该数据集包含来自不同学生的作文以及由语言模型生成的作文样本,适用于作文检测和评估。主要特征如下:...
    packageimg
  • 自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365

    2025年4月25日   

    自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,机器学习,文本分析,人工智能,语言模型,语义理解 数据概述: 该数据集包含来自多个语言的自然语言处理数据,记录了不同语言的文本内容及其相关信息。主要特征如下:...
    packageimg
  • 中文开源生成式对话数据集ChineseOpen-SourceGenerativeDialogueDataset-saugatkafley

    2025年4月25日   

    中文开源生成式对话数据集ChineseOpen-SourceGenerativeDialogueDataset-saugatkafley 数据来源:互联网公开数据 标签:对话系统,自然语言处理,数据集,生成式模型,语言模型,人工智能,机器学习,聊天机器人 数据概述: 该数据集包含来自开源社区的数据,记录了中文对话生成任务的相关内容。主要特征如下:...
    packageimg
  • 三星自然语言处理数据集SamsungNLPDataset-garvitgarg

    2025年4月25日   

    三星自然语言处理数据集SamsungNLPDataset-garvitgarg 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,情感分析,机器翻译 数据概述: 该数据集由三星公司提供,专注于自然语言处理领域的文本数据,记录了多种自然语言处理任务的训练和测试数据。主要特征如下:...
    packageimg