找到755个数据集

标签: 语言模型

过滤结果
  • AST-SQL数据集AST-SQLDataset-youssefhazemfarouk

    2025年4月25日   

    AST-SQL数据集AST-SQLDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:自然语言处理,SQL生成,数据集,机器学习,数据库,文本分析,语言模型,数据查询 数据概述: 该数据集专注于自然语言到SQL的转换任务,记录了如何将自然语言查询语句转换为相应的SQL查询语句。主要特征如下:...
    packageimg
  • 英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa

    2025年4月25日   

    英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:...
    packageimg
  • 英语写作关联特征训练数据集-kentakikuhi

    2025年4月25日   

    英语写作关联特征训练数据集-kentakikuhi 数据来源:互联网公开数据 标签:英语写作,数据集,自然语言处理,文本分析,机器学习,语言模型,写作质量,关联特征 数据概述: 该数据集包含了用于训练英语写作关联特征的数据,旨在提升写作质量和理解写作模式。主要特征如下: 时间跨度:数据没有明确的时间跨度,但通常涵盖现代英语写作。...
    packageimg
  • 社交媒体评论反讽检测数据集DetectSarcasminCommentsDataset-sachinichake

    2025年4月25日   

    社交媒体评论反讽检测数据集DetectSarcasminCommentsDataset-sachinichake 数据来源:互联网公开数据 标签:自然语言处理,情感分析,反讽检测,数据集,机器学习,文本分类,社交媒体,语言模型 数据概述: 该数据集包含来自社交媒体平台的用户评论数据,专注于识别和检测评论中的反讽内容。主要特征如下:...
    packageimg
  • 多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist

    2025年4月25日   

    多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance...
    packageimg
  • 大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet

    2025年4月25日   

    大型语言模型LLM训练数据集JAXLLaMA13BDataset-defdet 数据来源:互联网公开数据 标签:语言模型,机器学习,自然语言处理,深度学习,人工智能,文本生成,文本分析,大数据 数据概述: 该数据集包含用于训练大型语言模型(LLM)的文本数据,特别适用于JAX框架下的LLaMA 13B模型。主要特征如下:...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-nikunjphutela

    2025年4月25日   

    自然语言处理项目数据集NLPProjectDataset-nikunjphutela 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,语言模型,数据集,文本分类,情感分析 数据概述: 该数据集为自然语言处理项目专用,记录了多种文本数据及相关标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan

    2025年4月25日   

    超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,机器学习,深度学习,文本分类,语言模型,人工智能,数据集 数据概述: 该数据集包含来自超大规模预训练语言模型 HS-XLNet 的数据,记录了大规模文本语料的预训练过程和结果。主要特征如下:...
    packageimg
  • Commonlit阅读理解文本特征数据集-vaibhavnakrani

    2025年4月25日   

    Commonlit阅读理解文本特征数据集-vaibhavnakrani 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,文本分析,数据集,教育,机器学习,文本特征,语言模型 数据概述: 该数据集包含了Commonlit阅读理解竞赛的文本数据,旨在帮助研究人员和开发者构建更有效的阅读理解模型。主要特征如下:...
    packageimg
  • 学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech

    2025年4月25日   

    学生与语言模型作文检测数据集Studentvs-LLMEssayDetectionDataset-tafartech 数据来源:互联网公开数据 标签:学生作文,语言模型,数据集,自然语言处理,文本分析,机器学习,学术研究,教育评估 数据概述:该数据集包含来自不同学生的作文以及由语言模型生成的作文样本,适用于作文检测和评估。主要特征如下:...
    packageimg
  • 自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365

    2025年4月25日   

    自然语言处理多语言数据集NLPMultilingualDataset-ahmedmohamed365 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,机器学习,文本分析,人工智能,语言模型,语义理解 数据概述: 该数据集包含来自多个语言的自然语言处理数据,记录了不同语言的文本内容及其相关信息。主要特征如下:...
    packageimg
  • 中文开源生成式对话数据集ChineseOpen-SourceGenerativeDialogueDataset-saugatkafley

    2025年4月25日   

    中文开源生成式对话数据集ChineseOpen-SourceGenerativeDialogueDataset-saugatkafley 数据来源:互联网公开数据 标签:对话系统,自然语言处理,数据集,生成式模型,语言模型,人工智能,机器学习,聊天机器人 数据概述: 该数据集包含来自开源社区的数据,记录了中文对话生成任务的相关内容。主要特征如下:...
    packageimg
  • 三星自然语言处理数据集SamsungNLPDataset-garvitgarg

    2025年4月25日   

    三星自然语言处理数据集SamsungNLPDataset-garvitgarg 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,情感分析,机器翻译 数据概述: 该数据集由三星公司提供,专注于自然语言处理领域的文本数据,记录了多种自然语言处理任务的训练和测试数据。主要特征如下:...
    packageimg
  • 西班牙语微调标注数据集SpanishLabeledforFine-tuningDataset-suramyajadhav

    2025年4月25日   

    西班牙语微调标注数据集SpanishLabeledforFine-tuningDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,语言模型,文本分类,微调,西班牙语,标注数据 数据概述: 该数据集包含经过标注的西班牙语文本数据,专为语言模型的微调和训练设计。主要特征如下:...
    packageimg
  • 英语学习文本数据集en-train-csv-elguapo

    2025年4月25日   

    英语学习文本数据集en-train-csv-elguapo 数据来源:互联网公开数据 标签:英语学习,文本数据,自然语言处理,语言模型,数据集,语料库,机器学习,文本分析 数据概述: 该数据集包含了用于英语学习的文本数据,记录了大量的英语句子,段落及文章。主要特征如下: 时间跨度: 数据记录的时间范围不固定,涵盖了不同时期的英语文本。 地理范围:...
    packageimg
  • palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak

    2025年4月25日   

    palm作文生成评估数据集PalmEssayGenItr1Dataset-amankumartak 数据来源: 互联网公开数据 标签:作文生成,自然语言处理,数据集,机器学习,文本生成,语言模型,教育技术,评估研究 数据概述: 该数据集包含来自Palm作文生成项目(Palm Essay Generation...
    packageimg
  • 马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav

    2025年4月25日   

    马拉地语微调数据集MarathiFine-tuningDataDataset-suramyajadhav 数据来源:互联网公开数据 标签:自然语言处理,文本数据,机器学习,语言模型,数据集,多语言,语言微调,数据训练 数据概述: 该数据集包含马拉地语的文本数据,主要用作自然语言处理任务中的语言模型微调。主要特征如下:...
    packageimg
  • 预处理语言数据集PreprocessingLanguageData-biatrixwang

    2025年4月25日   

    预处理语言数据集PreprocessingLanguageData-biatrixwang 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,数据集,语言模型,文本分析,数据清洗,机器学习,中文处理 数据概述: 该数据集包含经过预处理的语言数据,旨在为自然语言处理任务提供干净,规范的文本输入。主要特征如下:...
    packageimg
  • 孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif

    2025年4月25日   

    孟加拉语文本摘要生成数据集BengaliTextSummarizationDataset-devtousif 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,机器翻译,数据集,深度学习,语言模型,机器学习,人工智能 数据概述: 该数据集专注于孟加拉语文本的摘要生成任务,记录了大量的孟加拉语文本及其对应的摘要。主要特征如下:...
    packageimg
  • 并行detoxification并行解毒数据集ParallelDetoxificationDataset-summerbreeze11

    2025年4月25日   

    并行detoxification并行解毒数据集ParallelDetoxificationDataset-summerbreeze11 数据来源:互联网公开数据 标签:自然语言处理,数据集,并行计算,解毒技术,文本过滤,机器学习,语言模型,安全分析 数据概述: 该数据集专注于并行解毒技术,包含大量文本数据及相应的解毒处理结果。主要特征如下:...
    packageimg