找到755个数据集

标签: 语言模型

过滤结果
  • 标题:基于人工智能生成的文本数据集(AI-Generated Text Dataset)

    2025年5月29日   

    标题:基于人工智能生成的文本数据集(AI-Generated Text Dataset) 数据来源:互联网公开数据 标签:人工智能,文本生成,数据集,自然语言处理,机器学习,文本分析,语言模型,数据挖掘 数据概述: 该数据集包含由人工智能模型生成的文本数据,旨在用于自然语言处理(NLP)相关的研究和应用。主要特征如下:...
    packageimg
  • 文本质量评估数据集TextQualityEvaluationDataset-goldenlock

    2025年5月29日   

    文本质量评估数据集TextQualityEvaluationDataset-goldenlock 数据来源:互联网公开数据 标签:文本评估, 语言模型, 文本分析, 写作质量, 语法, 连贯性, 词汇, 标注数据 数据概述: 该数据集包含用于评估文本写作质量的数据,记录了文本的各项语言学特征和人工评估结果。主要特征如下:...
    packageimg
  • 预处理后语料库数据集CorpusAfterPreprocessed18deDataset-ictworld

    2025年5月29日   

    预处理后语料库数据集CorpusAfterPreprocessed18deDataset-ictworld 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,数据预处理,机器学习,文本分类,语言模型,深度学习 数据概述: 该数据集包含经过预处理的文本数据,记录了经过清洗、分词和标准化等处理的语料信息。主要特征如下:...
    packageimg
  • 维基文本嵌入数据集WikitextTextEmbeddingsDataset-hozaifazaki99

    2025年5月29日   

    维基文本嵌入数据集WikitextTextEmbeddingsDataset-hozaifazaki99 数据来源:互联网公开数据 标签:文本嵌入,自然语言处理,数据集,机器学习,词向量,文本分析,语言模型,维基百科 数据概述:...
    packageimg
  • 图灵基准测试数据集TuringBenchDataset-robikiso

    2025年5月29日   

    图灵基准测试数据集TuringBenchDataset-robikiso 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,基准测试,模型评估,对话系统,语言模型,机器学习,文本生成 数据概述: 该数据集包含来自图灵基准测试的数据,记录了用于评估人工智能模型在各种任务上的表现,特别是自然语言理解和生成能力。主要特征如下:...
    packageimg
  • 阿拉伯新闻文章标题生成数据集-oussamaseffai

    2025年5月29日   

    阿拉伯新闻文章标题生成数据集-oussamaseffai 数据来源:互联网公开数据 标签:自然语言处理,文本生成,阿拉伯语,标题生成,机器学习,新闻文章,语言模型,NLP 数据概述: 该数据集包含了阿拉伯语新闻文章及其对应的标题,用于训练和评估阿拉伯语新闻标题生成模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了近期的新闻文章。...
    packageimg
  • 人工智能写作检测与校对数据集AIWritingDetectionandCorrectionDataset-gauravbrills

    2025年5月29日   

    人工智能写作检测与校对数据集AIWritingDetectionandCorrectionDataset-gauravbrills 数据来源:互联网公开数据 标签:人工智能, 文本分析, 写作评估, 机器写作, 语言模型, 文本校对, 教育, 自然语言处理 数据概述:...
    packageimg
  • 训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa

    2025年5月29日   

    训练集翻译数据集TrainingSetTranslationsDataset-franciscomisa 数据来源:互联网公开数据 标签:翻译,数据集,自然语言处理,机器学习,多语言,文本处理,语言模型,人工智能 数据概述: 该数据集包含来自多个公开来源的翻译训练数据,记录了多种语言之间的翻译对。主要特征如下:...
    packageimg
  • 学术与项目资料综合数据集AcademicandProjectDataCompilation-ghrangel

    2025年5月29日   

    学术与项目资料综合数据集AcademicandProjectDataCompilation-ghrangel 数据来源:互联网公开数据 标签:学术研究, 项目资料, 课程评估, SQL查询, 文本分析, 语言模型, 数据挖掘, 计算机视觉 数据概述:...
    packageimg
  • 大型语言模型人类行为大数据集LargeLanguageModelHumanBehaviorBigDataDataset-hemanthhvv

    2025年5月29日   

    大型语言模型人类行为大数据集LargeLanguageModelHumanBehaviorBigDataDataset-hemanthhvv 数据来源:互联网公开数据 标签:语言模型,人类行为,大数据,数据集,机器学习,自然语言处理,人工智能,行为分析 数据概述:...
    packageimg
  • 自然语言处理与文本分类数据集HuggingFaceDistilBERTClassificationDataset-leolu1998

    2025年5月29日   

    自然语言处理与文本分类数据集HuggingFaceDistilBERTClassificationDataset-leolu1998 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,深度学习,HuggingFace,DistilBERT,语言模型 数据概述:...
    packageimg
  • 印尼语问答数据集SQUAD-Variated-IndoDataset-mintupsidup

    2025年5月29日   

    印尼语问答数据集SQUAD-Variated-IndoDataset-mintupsidup 数据来源:互联网公开数据 标签:问答系统,自然语言处理,机器学习,数据集,印尼语,文本挖掘,语言模型,智能问答 数据概述: 该数据集包含来自印尼语的问答对数据,记录了印尼语文本中的问题和对应答案。主要特征如下: 时间跨度:数据记录的时间范围不明确。...
    packageimg
  • 文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg

    2025年5月29日   

    文本生成对话语料数据集TextGenerationDialogueCorpus-terrychanorg 数据来源:互联网公开数据 标签:文本生成, 对话系统, 语料库, 自然语言处理, 文本摘要, 机器翻译, 语言模型, 数据集 数据概述: 该数据集包含多个CSV文件,记录了用于文本生成和对话系统训练的语料。主要特征如下:...
    packageimg
  • 大型语言模型70k语境数据集LLM70kContextDataset-sugupoko

    2025年5月29日   

    大型语言模型70k语境数据集LLM70kContextDataset-sugupoko 数据来源:互联网公开数据 标签:语言模型,自然语言处理,数据集,机器学习,文本生成,深度学习,人工智能,自然语言理解 数据概述: 该数据集包含来自大型语言模型训练的数据,记录了包含语境的文本样本。主要特征如下: 时间跨度:数据记录的时间范围从近期到当前。...
    packageimg
  • 英文文档语料库数据集-ashwanillkagechaad

    2025年5月29日   

    英文文档语料库数据集-ashwanillkagechaad 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,英文,文档,语料库,语言模型,文本挖掘 数据概述:该数据集包含大量的英文文档,涵盖了多种主题和来源。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于文档的发布时间。 地理范围:数据来源广泛,覆盖全球范围内的英文文档。...
    packageimg
  • 多新闻摘要数据集MultiNewsDataset-nguyenvuthanhtung

    2025年5月29日   

    多新闻摘要数据集MultiNewsDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,数据集,新闻,机器学习,信息检索,深度学习,语言模型 数据概述: 该数据集包含来自新闻网站的多个新闻报道及其对应的摘要,旨在用于文本摘要任务。主要特征如下:...
    packageimg
  • 英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg

    2025年5月29日   

    英语相似度评估数据集EnglishSimilarityAssessmentDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,相似度评估,数据集,文本分析,机器学习,语义理解,人工智能,语言模型 数据概述: 该数据集包含用于评估英语文本相似度的数据,记录了不同文本对之间的相似度评分。主要特征如下:...
    packageimg
  • 越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68

    2025年5月29日   

    越南语文本纠错数据集VietnameseTextErrorCorrectionDataset-haphan68 数据来源:互联网公开数据 标签:越南语, 文本纠错, 自然语言处理, 语言模型, 文本校对, 数据清洗, 机器翻译, 拼写纠错 数据概述: 该数据集包含越南语文本的错误文本及其对应的正确文本,用于越南语文本的纠错任务。主要特征如下:...
    packageimg
  • 语言模型与人类文本对比数据集LLMvsHumanTextComparisonDataset-mohamedlotfy50

    2025年5月29日   

    语言模型与人类文本对比数据集LLMvsHumanTextComparisonDataset-mohamedlotfy50 数据来源:互联网公开数据 标签:自然语言处理,文本对比,数据集,机器学习,语言模型,人类文本,人工智能,文本分析 数据概述:...
    packageimg
  • 人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream

    2025年5月29日   

    人工智能与人类文本对比数据集AIandHumanTextComparisonDataset-naveenfream 数据来源:互联网公开数据 标签:自然语言处理,文本分类,ai生成,人类写作,机器学习,文本分析,语言模型,数据挖掘 数据概述:...
    packageimg