找到755个数据集

标签: 语言模型

过滤结果
  • 计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002

    2025年5月28日   

    计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent...
    packageimg
  • 大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian

    2025年5月28日   

    大型语言模型新筛选数据集LLMNewFilteredDataset-ashkankhademian 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,机器学习,语言模型,文本分析,深度学习,模型训练 数据概述: 该数据集包含经过筛选的大型语言模型(LLM)训练数据,记录了用于优化和训练语言模型的文本内容。主要特征如下:...
    packageimg
  • 写作质量特征工程数据集-mcpenguin

    2025年5月28日   

    写作质量特征工程数据集-mcpenguin 数据来源:互联网公开数据 标签:写作质量,特征工程,自然语言处理,数据集,文本分析,机器学习,语言模型,内容评估 数据概述: 该数据集包含了经过特征工程处理的文本数据,旨在用于评估和预测文本的写作质量。主要特征如下: 时间跨度: 数据集未明确标注时间跨度,但数据来源于不同时间段的文本内容。 地理范围:...
    packageimg
  • 跨编码器数据集Cross-EncoderDataset-epsilon12345

    2025年5月28日   

    跨编码器数据集Cross-EncoderDataset-epsilon12345 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本匹配,语义相似度,信息检索,深度学习,模型训练,语言模型 数据概述: 该数据集包含了用于训练和评估跨编码器模型的数据,主要用于提升文本匹配和语义理解的性能。主要特征如下:...
    packageimg
  • 大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202

    2025年5月28日   

    大型语言模型版本三按来源拆分数据集LLMV3SplitbySourceDataset-saiyan1202 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,数据拆分,文本分析,人工智能,模型训练 数据概述: 该数据集为大型语言模型版本三(LLM V3)的数据集,按照数据来源进行拆分,记录了不同来源的文本数据。主要特征如下:...
    packageimg
  • DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99

    2025年5月28日   

    DRCAT文本摘要数据集DRCATDatasetwithReferenceText-hozaifazaki99 数据来源:互联网公开数据 标签:文本摘要,数据集,自然语言处理,机器翻译,深度学习,文本分析,语言模型,信息检索 数据概述: 该数据集包含来自DRCAT(Dynamic Relation-based Content Adaptation...
    packageimg
  • 讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad

    2025年5月28日   

    讽刺文本识别与情感分析数据集Sarcasm-ZipDataset-jazimhammad 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本分类,语言模型,人工智能,文本挖掘 数据概述: 该数据集专注于包含讽刺语气的文本数据,记录了不同来源的文本内容,适用于讽刺文本识别和情感分析等任务。主要特征如下:...
    packageimg
  • 大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan

    2025年5月28日   

    大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:...
    packageimg
  • 写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar

    2025年5月28日   

    写作风格与生成文本检测数据集WritingStyle-GeneratedTextDetectionDataset-shijirbatbaatar 数据来源:互联网公开数据 标签:文本分析, 写作风格, 机器生成文本, 文本分类, 自然语言处理, 论文写作, 语言模型, 数据集 数据概述:...
    packageimg
  • PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi

    2025年5月28日   

    PSPV5C嵌入向量数据集PSPV5CEmbeddingsDataset-shinomoriaoshi 数据来源:互联网公开数据 标签:嵌入向量,数据集,自然语言处理,机器学习,文本分析,深度学习,语言模型,语义理解 数据概述:该数据集包含来自PSPV5C模型的嵌入向量数据,记录了大量文本数据的语义表示。主要特征如下:...
    packageimg
  • 大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13

    2025年5月28日   

    大型语言模型分类微调数据集LLMClassificationFine-tuningDataset-manishkumarpatel13 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分类,深度学习,人工智能,语言模型,模型微调 数据概述: 该数据集专注于大型语言模型(Large Language Model,...
    packageimg
  • 阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed

    2025年5月28日   

    阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 文本摘要, 语言模型, 数据集 数据概述: 该数据集包含来自阿拉伯语新闻文章及其对应的摘要。主要特征如下:...
    packageimg
  • 大规模语言模型超反馈平衡数据集LMSYSUltraFeedbackDataset-Balanced-sethmoudry

    2025年5月28日   

    大规模语言模型超反馈平衡数据集LMSYSUltraFeedbackDataset-Balanced-sethmoudry 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,模型训练,情感分析,文本分类,人工智能 数据概述:...
    packageimg
  • 写作质量评估论文数据集EssayQualityAssessmentEssays-laurensprast

    2025年5月28日   

    写作质量评估论文数据集EssayQualityAssessmentEssays-laurensprast 数据来源:互联网公开数据 标签:写作评估, 文本分析, 情感分析, 论文写作, 语言模型, 机器学习, 文本分类, 写作技巧 数据概述: 该数据集包含来自多个来源的英文论文,记录了不同来源的论文文本及其对应的质量标签。主要特征如下:...
    packageimg
  • 语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie

    2025年5月28日   

    语言纠错词汇校对数据集LanguageCorrectionVocabularyCalibrationDataset-yeoyunsianggeremie 数据来源:互联网公开数据 标签:语言校对, 文本处理, 词汇纠错, 语法检查, 自然语言处理, 语言模型, 词典, 数据集 数据概述:...
    packageimg
  • 越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree

    2025年5月28日   

    越南语问答数据集VietnameseQuestionAnsweringDataset-anhnguyenkagglethree 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 文本理解, 越南语, 语料库, 信息检索, 语言模型, 数据集 数据概述: 该数据集包含来自越南语问答系统的数据,记录了越南语问题及其对应的标识符。主要特征如下:...
    packageimg
  • 文本可读性评估训练数据集TextReadabilityAssessmentTrainingDataset-siminrao

    2025年5月28日   

    文本可读性评估训练数据集TextReadabilityAssessmentTrainingDataset-siminrao 数据来源:互联网公开数据 标签:文本可读性, 自然语言处理, 文本分析, 机器学习, 文本难度, 语言模型, 数据集, 训练数据 数据概述:...
    packageimg
  • 越南语自然语言处理NLP数据集-minhhieuhuynh

    2025年5月28日   

    越南语自然语言处理NLP数据集-minhhieuhuynh 数据来源:互联网公开数据 标签:自然语言处理,越南语,文本分析,机器翻译,情感分析,数据集,语言模型,文本挖掘 数据概述: 该数据集包含来自越南语文本的数据,用于自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间跨度不定,取决于具体子数据集,可能涵盖多年。...
    packageimg
  • 评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906

    2025年5月28日   

    评论翻译与校对数据集CommentsTranslationandProofreadingDataset-yamak1906 数据来源:互联网公开数据 标签:自然语言处理,文本翻译,数据集,语言模型,机器学习,文本校对,机器翻译,文本处理 数据概述: 该数据集包含来自互联网的评论数据,记录了不同语言之间的评论翻译与校对信息。主要特征如下:...
    packageimg
  • 世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro

    2025年5月28日   

    世宗人工智能挑战赛数据集SejongAIChallengeDataset-mkpuro 数据来源:互联网公开数据 标签:人工智能,数据集,自然语言处理,文本分类,机器翻译,情感分析,语言模型,韩国语 数据概述: 该数据集包含来自世宗人工智能挑战赛的竞赛数据,主要涉及韩国语的文本处理任务。主要特征如下: 时间跨度:数据记录的时间范围为挑战赛期间。...
    packageimg