-
大语言模型对话比较数据集LargeLanguageModelDialogueComparisonDataset-sparsh35
大语言模型对话比较数据集LargeLanguageModelDialogueComparisonDataset-sparsh35 数据来源:互联网公开数据 标签:大语言模型, 对话分析, 模型评估, 自然语言处理, 文本生成, 对比分析, 机器学习, 英语 数据概述:... -
图像描述生成多模态数据集ImageCaptioningMultimodalDataset-mahsamohammady
图像描述生成多模态数据集ImageCaptioningMultimodalDataset-mahsamohammady 数据来源:互联网公开数据 标签:图像识别, 文本生成, 图像描述, 多模态学习, 计算机视觉, 自然语言处理, 数据标注, 深度学习 数据概述:... -
预训练语言模型掩码任务训练数据集Pre-trainedLanguageModelMaskedLanguageModelingDataset-yuzhoudiyishuai
预训练语言模型掩码任务训练数据集Pre-trainedLanguageModelMaskedLanguageModelingDataset-yuzhoudiyishuai 数据来源:互联网公开数据 标签:自然语言处理, 预训练, 语言模型, 掩码语言模型, 文本数据, 深度学习, 文本生成, 数据集构建 数据概述:... -
多模态图像文本描述生成数据集MultimodalImage-TextDescriptionGenerationDataset-yutaroatarashi
多模态图像文本描述生成数据集MultimodalImage-TextDescriptionGenerationDataset-yutaroatarashi 数据来源:互联网公开数据 标签:图像描述, 文本生成, 多模态学习, 视觉语言, 图像标注, 自然语言处理, 机器翻译, 数据集构建 数据概述:... -
Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen
Gemma模型重写数据集RewrittenGemma-7bDataset-patrickjchen 数据来源:互联网公开数据 标签:自然语言处理,机器学习,深度学习,文本生成,语言模型,模型重写,人工智能,大语言模型 数据概述: 该数据集包含对Gemma-7b语言模型的输出进行重写的数据,记录了原始文本和经过模型重写后的文本。主要特征如下:... -
文本生成检测机器学习数据集TextGenerationDetectionMLDataset-scottsang
文本生成检测机器学习数据集TextGenerationDetectionMLDataset-scottsang 数据来源:互联网公开数据 标签:文本生成,检测,数据集,机器学习,自然语言处理,深度学习,人工智能,数据科学 数据概述:该数据集包含来自多个来源的文本数据,记录了真实文本与机器生成文本的样本,适用于文本生成检测和机器学习任务。主要特征如下:... -
新闻文本摘要生成数据集NewsTextSummarizationDataset-mamatva
新闻文本摘要生成数据集NewsTextSummarizationDataset-mamatva 数据来源:互联网公开数据 标签:文本摘要, 新闻文章, 自然语言处理, 文本生成, 机器翻译, 数据集, 深度学习, 文本分析 数据概述: 该数据集包含来自新闻网站的英文新闻文章及其对应的标题和摘要,主要用于训练和评估文本摘要模型。主要特征如下:... -
歌词生成数据集LyricsGenerationDataset-ankitshah30
歌词生成数据集LyricsGenerationDataset-ankitshah30 数据来源:互联网公开数据 标签:歌词生成,数据集,自然语言处理,文本生成,机器学习,音乐分析,文化研究,人工智能 数据概述: 该数据集包含来自多个来源的歌词文本,记录了不同歌曲的歌词内容。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
多语言问答与生成数据集MultilingualQuestionAnsweringandGenerationDataset-sajanakhleh
多语言问答与生成数据集MultilingualQuestionAnsweringandGenerationDataset-sajanakhleh 数据来源:互联网公开数据 标签:问答系统, 自然语言处理, 机器翻译, 数据增强, 文本生成, 语料库, 摘要生成, 多语言 数据概述:... -
文本生成与偏见检测学术论文数据集TextGenerationandBiasDetectionAcademicPapersDataset-aravind36
文本生成与偏见检测学术论文数据集TextGenerationandBiasDetectionAcademicPapersDataset-aravind36 数据来源:互联网公开数据 标签:文本生成, 偏见检测, 自然语言处理, 论文写作, 机器学习, 数据标注, 文本分类, 语料分析 数据概述:... -
写作过程与文本生成关联数据集LinkingWritingProcessesDataset-darraghdog
写作过程与文本生成关联数据集LinkingWritingProcessesDataset-darraghdog 数据来源:互联网公开数据 标签:人工智能,自然语言处理,写作过程,文本生成,机器学习,教育技术,数据分析,写作辅助 数据概述: 该数据集记录了写作过程中的行为与文本生成之间的关联数据,主要特征如下:... -
语言模型系统大规模数据集LMSys72KDataset-qinhaoyang
语言模型系统大规模数据集LMSys72KDataset-qinhaoyang 数据来源:互联网公开数据 标签:语言模型,自然语言处理,数据集,机器学习,文本分析,人工智能,大数据,文本生成 数据概述: 该数据集由LMSys项目提供,包含大规模的文本数据,适用于语言模型训练、自然语言处理及文本生成等任务。主要特征如下:... -
图像描述生成数据集ImageCaptionGenerationDataset-dinararzayeva
图像描述生成数据集ImageCaptionGenerationDataset-dinararzayeva 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 图像识别, 文本生成, 数据集, 深度学习, 图像标注 数据概述: 该数据集包含图像及其对应的描述文本,旨在促进图像描述生成任务的研究。主要特征如下:... -
AI生成内容数据集AI-Stuff-jordanpainter
AI生成内容数据集AI-Stuff-jordanpainter 数据来源:互联网公开数据 标签:人工智能,生成模型,数据集,文本生成,图像生成,多模态,自然语言处理,机器学习 数据概述: 该数据集包含各种由人工智能模型生成的内容,涵盖文本、图像、音频等多种模态。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于生成内容的时间。... -
越南新闻文本摘要数据集VietnameseNewsTextSummarizationDataset-uyentruong
越南新闻文本摘要数据集VietnameseNewsTextSummarizationDataset-uyentruong 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 越南语, 机器翻译, 深度学习, 文本生成, 语料库, 数据集 数据概述: 该数据集包含来自越南新闻的文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
文本摘要生成训练数据集TextSummarizationTrainingDataset-mridul3301
文本摘要生成训练数据集TextSummarizationTrainingDataset-mridul3301 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 机器翻译, 深度学习, 文本生成, 数据集构建, 摘要生成, 语料库 数据概述: 该数据集包含用于文本摘要任务的训练数据,记录了源文本及其对应的摘要。主要特征如下:... -
语言模型多轮对话质量评估数据集LanguageModelMulti-turnDialogueQualityEvaluation-mbaiornommbaihodji
语言模型多轮对话质量评估数据集LanguageModelMulti-turnDialogueQualityEvaluation-mbaiornommbaihodji 数据来源:互联网公开数据 标签:多轮对话, 语言模型, 对话质量, 文本生成, 语义理解, 评估, 机器学习, 自然语言处理 数据概述:... -
文本生成与欺骗检测论文写作数据集TextGenerationandDeceptionDetectionEssayDataset-laurensprast
文本生成与欺骗检测论文写作数据集TextGenerationandDeceptionDetectionEssayDataset-laurensprast 数据来源:互联网公开数据 标签:文本生成, 欺骗检测, 论文写作, 语言模型, 自然语言处理, 文本分类, 机器学习, 数据标注 数据概述:... -
新闻摘要生成数据集XLSumCSVDataset-phoenixdev
新闻摘要生成数据集XLSumCSVDataset-phoenixdev 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,文本生成,机器学习,信息提取,人工智能,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻摘要数据,记录了新闻文章及其对应的摘要信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2021年。... -
图像描述土耳其语数据集ImageCaptioningTurkishDataset-yusufmertelikarslan
图像描述土耳其语数据集ImageCaptioningTurkishDataset-yusufmertelikarslan 数据来源:互联网公开数据 标签:图像描述, 计算机视觉, 自然语言处理, 土耳其语, 图像标注, 文本生成, 多模态学习, 图像检索 数据概述:...