找到730个数据集

标签: 语言模型

过滤结果
  • 孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal

    2025年4月26日   

    孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,孟加拉语,新闻,数据集,NLP,机器翻译,语言模型 数据概述: 该数据集包含来自孟加拉语新闻网站Prothom Alo的新闻文章及其摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了Prothom...
    packageimg
  • JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555

    2025年4月26日   

    JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试...
    packageimg
  • 大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp

    2025年4月26日   

    大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp 数据来源:互联网公开数据 标签:人工智能,语言模型,文本数据,自然语言处理,机器学习,深度学习,数据集,多语言处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了大型语言模型(LLM)和人工智能(AI)生成的文本内容。主要特征如下:...
    packageimg
  • 生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand

    2025年4月26日   

    生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,文本对比,语言模型,人工智能,数据科学 数据概述:...
    packageimg
  • 大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni

    2025年4月26日   

    大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni 数据来源:互联网公开数据 标签:人工智能,机器学习,数据集,自然语言处理,语言模型,深度学习,算法竞赛,应用研究 数据概述: 该数据集源自大型语言模型应用与机器学习挑战(LLMAO-ML...
    packageimg
  • 蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020

    2025年4月26日   

    蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本翻译,深度学习,语言模型,翻译研究,计算机科学 数据概述: 该数据集包含来自Spider项目的翻译数据,记录了多种语言之间的文本翻译对。主要特征如下:...
    packageimg
  • 对话数据集样本ConvoDatasetSample-rigveddesai

    2025年4月26日   

    对话数据集样本ConvoDatasetSample-rigveddesai 数据来源:互联网公开数据 标签:对话,文本,自然语言处理,数据集,语言模型,情感分析,文本生成,聊天机器人 数据概述: 该数据集包含对话文本样本,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时间段的对话。...
    packageimg
  • 提示词数据集PromptsDataset1-sandeepnambiar02

    2025年4月26日   

    提示词数据集PromptsDataset1-sandeepnambiar02 数据来源:互联网公开数据 标签:自然语言处理,数据集,提示工程,人工智能,机器学习,文本生成,语言模型,数据挖掘 数据概述: 该数据集专注于收集各类提示词(prompts),记录了不同场景下的文本提示信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti

    2025年4月22日   

    香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti 数据来源:互联网公开数据 标签:香港证监会,注册数据,人口统计信息,性别,种族,年龄,姓名分析,大数据,语言模型 数据概述:...
    packageimg
  • 文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees

    2025年4月26日   

    文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,深度学习,NLP,文本分析,语言模型 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在训练和评估自动文本摘要模型。主要特征如下: 时间跨度:...
    packageimg
  • 全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz

    2025年4月26日   

    全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,语言模型,文本分析,摘要生成 数据概述:...
    packageimg
  • 笑话内容分类数据集JokesDataset-yaroslav62

    2025年4月26日   

    笑话内容分类数据集JokesDataset-yaroslav62 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,幽默分析,机器学习,情感分析,娱乐内容,语言模型 数据概述: 该数据集包含来自互联网的笑话内容数据,记录了各类笑话的文本信息及其相关分类标签。主要特征如下:...
    packageimg
  • 语法修正数据集GrammarCorrectionDataDataset-uwelcomem

    2025年4月26日   

    语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源:互联网公开数据 标签:自然语言处理,语法修正,数据集,机器学习,语言模型,文本分析,人工智能,语言技术 数据概述:该数据集包含来自互联网公开来源的语法修正数据,记录了原始文本及其对应的修正文本。主要特征如下: 时间跨度:数据记录的时间范围为近年。...
    packageimg
  • 辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore

    2025年4月26日   

    辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore 数据来源:互联网公开数据 标签:剧本,文本分析,数据集,自然语言处理,机器学习,电视节目,对话分析,语言模型 数据概述:该数据集包含来自美国情景喜剧《辛普森一家》第一季的剧本文本数据,记录了节目的对话和剧情内容。主要特征如下:...
    packageimg
  • 大型语言模型科学与GPT-4技术数据集LargeLanguageModelScienceandGPT-4TechnologyDataset-optimo

    2025年4月26日   

    大型语言模型科学与GPT-4技术数据集LargeLanguageModelScienceandGPT-4TechnologyDataset-optimo 数据来源:互联网公开数据 标签:人工智能,语言模型,数据集,机器学习,自然语言处理,深度学习,算法研究,科技应用 数据概述:...
    packageimg
  • UIT问答数据集UITQADataset-callmelee117

    2025年4月26日   

    UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:...
    packageimg
  • 多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc

    2025年4月26日   

    多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc 数据来源:互联网公开数据 标签:机器翻译,文本转换,多任务学习,数据集,自然语言处理,深度学习,人工智能,语言模型 数据概述: 该数据集由MT5(Multitask Translation Transformer)项目提供,专注于多任务翻译和文本转换任务。主要特征如下:...
    packageimg
  • 文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban

    2025年4月26日   

    文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban 数据来源:互联网公开数据 标签:自然语言处理, 文本标注, 数据集, 机器学习, 深度学习, 语义分析, 语言模型, 计算语言学 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的文本标签信息。主要特征如下:...
    packageimg
  • 文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro

    2025年4月26日   

    文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:...
    packageimg
  • 书籍文本错误纠正数据集-shuaibing

    2025年4月26日   

    书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。...
    packageimg