-
文本生成与真伪识别平衡数据集TextGeneration-AuthenticityBalancedDataset-nju123
文本生成与真伪识别平衡数据集TextGeneration-AuthenticityBalancedDataset-nju123 数据来源:互联网公开数据 标签:文本生成, 自然语言处理, 文本分类, 真伪辨别, 数据平衡, 机器写作, 语料分析, 深度学习 数据概述: 该数据集包含来自文本生成任务的数据,记录了文本内容及其生成状态。主要特征如下:... -
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92
写作评估与生成文本分析数据集WritingEvaluation-GeneratedTextAnalysisDataset-conjuring92 数据来源:互联网公开数据 标签:文本生成, 写作评估, 自然语言处理, 机器学习, 文本分析, 创作质量, 论文写作, 语料库 数据概述:... -
人工智能生成文本对比人类文本清洗数据集-dillonwongso
人工智能生成文本对比人类文本清洗数据集-dillonwongso 数据来源:互联网公开数据 标签:人工智能,文本生成,文本清洗,数据集,自然语言处理,机器学习,文本分析,对比研究 数据概述: 该数据集包含来自不同来源的人工智能生成文本和人类编写的文本,并经过清洗处理,旨在用于比较分析。主要特征如下:... -
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan
大规模语言模型扩充训练数据集LargeLanguageModelSEExtraTrainDatasets-ranchantan 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,机器学习,文本生成,深度学习,人工智能,多语言支持 数据概述: 该数据集包含来自多个来源的大规模文本数据,用于扩充和训练大规模语言模型。主要特征如下:... -
图像描述生成数据集ImageCaptionsDataset-sandhyas29
图像描述生成数据集ImageCaptionsDataset-sandhyas29 数据来源:互联网公开数据 标签:图像描述,数据集,计算机视觉,自然语言处理,深度学习,图像识别,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练图像描述生成模型。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期和场景的图像。... -
数学问题解答数据集MathematicsProblemAnsweringDataset-saadtahmid
数学问题解答数据集MathematicsProblemAnsweringDataset-saadtahmid 数据来源:互联网公开数据 标签:数学, 问题解答, 自然语言处理, 文本生成, 数学教育, 问答系统, 机器学习, 数据集 数据概述: 该数据集包含来自互联网的数学问题及其对应的解答,旨在用于训练和评估数学问题解答模型。主要特征如下:... -
代码API序列生成与注释数据集CodeAPISequenceGenerationandAnnotationDataset-abdaman
代码API序列生成与注释数据集CodeAPISequenceGenerationandAnnotationDataset-abdaman 数据来源:互联网公开数据 标签:代码生成, API序列, 软件工程, 机器学习, 自然语言处理, 代码注释, 源代码分析, 文本生成 数据概述:... -
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed
阿拉伯语新闻摘要数据集ArabicNewsSummarizationDataset-omarrelsayeed 数据来源:互联网公开数据 标签:新闻摘要, 自然语言处理, 阿拉伯语, 文本生成, 机器翻译, 文本摘要, 语言模型, 数据集 数据概述: 该数据集包含来自阿拉伯语新闻文章及其对应的摘要。主要特征如下:... -
巴基斯坦新闻摘要生成文本数据集PakistanNewsSummaryGenerationTextDataset-nguyenvuthanhtung
巴基斯坦新闻摘要生成文本数据集PakistanNewsSummaryGenerationTextDataset-nguyenvuthanhtung 数据来源:互联网公开数据 标签:新闻摘要, 文本生成, 自然语言处理, 新闻事件, 文本分析, 摘要生成, 深度学习, 数据集 数据概述:... -
科技论文摘要生成数据集ScientificPaperAbstractGeneration-mridul3301
科技论文摘要生成数据集ScientificPaperAbstractGeneration-mridul3301 数据来源:互联网公开数据 标签:文本生成, 摘要, 自然语言处理, 机器翻译, 论文写作, 深度学习, 语料库, 学术研究 数据概述: 该数据集包含来自学术论文的数据,记录了论文原文与对应的摘要。主要特征如下:... -
文本摘要生成俄语新闻数据集TextSummarizationRussianNewsDataset-nmaria
文本摘要生成俄语新闻数据集TextSummarizationRussianNewsDataset-nmaria 数据来源:互联网公开数据 标签:文本摘要, 俄语, 新闻, 自然语言处理, 机器翻译, 深度学习, 数据集, 文本生成 数据概述: 该数据集包含来自新闻媒体的俄语新闻文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:... -
新闻摘要生成文本数据集NewsSummarizationTextDataset-vansy08
新闻摘要生成文本数据集NewsSummarizationTextDataset-vansy08 数据来源:互联网公开数据 标签:文本摘要, 自然语言处理, 新闻分析, 文本生成, 深度学习, 机器翻译, 语料库, 数据集 数据概述: 该数据集包含来自新闻网站的文章及其对应的摘要,用于训练和评估文本摘要模型。主要特征如下:... -
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu
大型语言模型训练提示数据集LLMPromptTrainDataDataset-kuohsintu 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,机器学习,文本生成,对话系统,人工智能,语言技术 数据概述:该数据集包含用于训练大型语言模型的提示数据,记录了多种类型的对话和文本生成任务的示例。主要特征如下:... -
图像标注数据集DataImageCaptioningDataset-whynamee
图像标注数据集DataImageCaptioningDataset-whynamee 数据来源:互联网公开数据 标签:图像标注,数据集,计算机视觉,自然语言处理,深度学习,图像描述,文本生成,人工智能 数据概述: 该数据集包含图像及其对应的文本描述,旨在用于训练和评估图像标注模型。主要特征如下: 时间跨度:数据记录的时间跨度不限,持续更新。... -
商标图像描述数据集TrademarkImageDescriptionDataset-kingdsl
商标图像描述数据集TrademarkImageDescriptionDataset-kingdsl 数据来源:互联网公开数据 标签:商标识别, 图像描述, 计算机视觉, 文本生成, 图像标注, 深度学习, 自然语言处理, 品牌分析 数据概述: 该数据集包含来自互联网的商标图像及其对应的文字描述,记录了不同商标的视觉特征和相关文本信息。主要特征如下:... -
写作内容生成评估训练数据集EssayWritingContentGenerationEvaluationDataset-conjuring92
写作内容生成评估训练数据集EssayWritingContentGenerationEvaluationDataset-conjuring92 数据来源:互联网公开数据 标签:写作评估, 文本生成, 机器学习, 自然语言处理, 情感分析, 写作质量, 文本相似度, 语料库 数据概述:... -
新闻摘要生成深度学习数据集NewsSummarizationDatasetforDeepLearning-luisllll
新闻摘要生成深度学习数据集NewsSummarizationDatasetforDeepLearning-luisllll 数据来源:互联网公开数据 标签:新闻摘要,数据集,自然语言处理,深度学习,文本生成,机器学习,语言模型,人工智能 数据概述:该数据集包含来自多个新闻平台的新闻文章及其对应的摘要,记录了新闻内容的文本信息和精简摘要。主要特征如下:... -
人类与大型语言模型LLM文本交叉对比数据集-mohamedlotfy50
人类与大型语言模型LLM文本交叉对比数据集-mohamedlotfy50 数据来源:互联网公开数据 标签:文本分析,大型语言模型,人类写作,数据集,自然语言处理,对比分析,机器学习,文本生成 数据概述: 该数据集包含人类创作的文本与大型语言模型生成的文本的对比数据,旨在研究人类写作风格与LLM生成文本的差异。主要特征如下:... -
医疗问答指令数据集MedicalQuestionAnsweringInstructionDataset-arungarimella
医疗问答指令数据集MedicalQuestionAnsweringInstructionDataset-arungarimella 数据来源:互联网公开数据 标签:医疗, 问答系统, 指令, 自然语言处理, 文本生成, 医疗健康, 大模型, 数据标注 数据概述:... -
计算机视觉与自然语言处理交叉领域数据集-sai1881
计算机视觉与自然语言处理交叉领域数据集-sai1881 数据来源:互联网公开数据 标签:计算机视觉,自然语言处理,跨模态,数据集,图像描述,文本生成,多模态学习,人工智能 数据概述:该数据集包含图像与文本的配对数据,主要用于研究计算机视觉与自然语言处理(NLP)的交叉领域。主要特征如下: 时间跨度:数据记录的时间范围不限。...