-
孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal
孟加拉语新闻摘要数据集ProthomAlo-towhidahmedfoysal 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,孟加拉语,新闻,数据集,NLP,机器翻译,语言模型 数据概述: 该数据集包含来自孟加拉语新闻网站Prothom Alo的新闻文章及其摘要。主要特征如下: 时间跨度:数据记录的时间范围未知,但涵盖了Prothom... -
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555
JigsawTPU验证与测试数据翻译数据集JigsawTPUValidationandTestDataTranslatedDataset-ma7555 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本分类,深度学习,数据验证,人工智能,语言模型 数据概述: 该数据集包含来自 Jigsaw 项目的数据,记录了用于验证和测试... -
大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp
大型语言模型与人工智能文本数据集LLM-AI-TextDataset-snehapriyaamp 数据来源:互联网公开数据 标签:人工智能,语言模型,文本数据,自然语言处理,机器学习,深度学习,数据集,多语言处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了大型语言模型(LLM)和人工智能(AI)生成的文本内容。主要特征如下:... -
生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand
生成文本与真实文本对比数据集GTP-GeneratedTextvs-RealTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,文本对比,语言模型,人工智能,数据科学 数据概述:... -
大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni
大型语言模型应用与机器学习挑战数据集LLMAO-MLChallengeDataset-rachitpatni 数据来源:互联网公开数据 标签:人工智能,机器学习,数据集,自然语言处理,语言模型,深度学习,算法竞赛,应用研究 数据概述: 该数据集源自大型语言模型应用与机器学习挑战(LLMAO-ML... -
蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020
蜘蛛翻译数据集SpiderTranslationDataset-ahmedheakl2020 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本翻译,深度学习,语言模型,翻译研究,计算机科学 数据概述: 该数据集包含来自Spider项目的翻译数据,记录了多种语言之间的文本翻译对。主要特征如下:... -
对话数据集样本ConvoDatasetSample-rigveddesai
对话数据集样本ConvoDatasetSample-rigveddesai 数据来源:互联网公开数据 标签:对话,文本,自然语言处理,数据集,语言模型,情感分析,文本生成,聊天机器人 数据概述: 该数据集包含对话文本样本,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围不固定,涵盖了不同时间段的对话。... -
提示词数据集PromptsDataset1-sandeepnambiar02
提示词数据集PromptsDataset1-sandeepnambiar02 数据来源:互联网公开数据 标签:自然语言处理,数据集,提示工程,人工智能,机器学习,文本生成,语言模型,数据挖掘 数据概述: 该数据集专注于收集各类提示词(prompts),记录了不同场景下的文本提示信息。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti
香港证监会注册数据集-姓名蕴含的人口统计信息丰富数据集-2003至今-gautiermarti 数据来源:互联网公开数据 标签:香港证监会,注册数据,人口统计信息,性别,种族,年龄,姓名分析,大数据,语言模型 数据概述:... -
文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees
文本摘要生成数据集ExtractiveSummaryDataset-rizwanidrees 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器翻译,深度学习,NLP,文本分析,语言模型 数据概述: 该数据集包含用于文本摘要任务的文本数据,旨在训练和评估自动文本摘要模型。主要特征如下: 时间跨度:... -
全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz
全模型子集-文本摘要数据集FullModelSubsets-TextSummarizationDataset-herobartosz 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,语言模型,文本分析,摘要生成 数据概述:... -
笑话内容分类数据集JokesDataset-yaroslav62
笑话内容分类数据集JokesDataset-yaroslav62 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,幽默分析,机器学习,情感分析,娱乐内容,语言模型 数据概述: 该数据集包含来自互联网的笑话内容数据,记录了各类笑话的文本信息及其相关分类标签。主要特征如下:... -
语法修正数据集GrammarCorrectionDataDataset-uwelcomem
语法修正数据集GrammarCorrectionDataDataset-uwelcomem 数据来源:互联网公开数据 标签:自然语言处理,语法修正,数据集,机器学习,语言模型,文本分析,人工智能,语言技术 数据概述:该数据集包含来自互联网公开来源的语法修正数据,记录了原始文本及其对应的修正文本。主要特征如下: 时间跨度:数据记录的时间范围为近年。... -
辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore
辛普森第一季剧本文本数据集SeinfeldSeason1TranscriptDataset-kingsleymoore 数据来源:互联网公开数据 标签:剧本,文本分析,数据集,自然语言处理,机器学习,电视节目,对话分析,语言模型 数据概述:该数据集包含来自美国情景喜剧《辛普森一家》第一季的剧本文本数据,记录了节目的对话和剧情内容。主要特征如下:... -
大型语言模型科学与GPT-4技术数据集LargeLanguageModelScienceandGPT-4TechnologyDataset-optimo
大型语言模型科学与GPT-4技术数据集LargeLanguageModelScienceandGPT-4TechnologyDataset-optimo 数据来源:互联网公开数据 标签:人工智能,语言模型,数据集,机器学习,自然语言处理,深度学习,算法研究,科技应用 数据概述:... -
UIT问答数据集UITQADataset-callmelee117
UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:... -
多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc
多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc 数据来源:互联网公开数据 标签:机器翻译,文本转换,多任务学习,数据集,自然语言处理,深度学习,人工智能,语言模型 数据概述: 该数据集由MT5(Multitask Translation Transformer)项目提供,专注于多任务翻译和文本转换任务。主要特征如下:... -
文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban
文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban 数据来源:互联网公开数据 标签:自然语言处理, 文本标注, 数据集, 机器学习, 深度学习, 语义分析, 语言模型, 计算语言学 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的文本标签信息。主要特征如下:... -
文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro
文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:... -
书籍文本错误纠正数据集-shuaibing
书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。...