-
魔法提示生成数据集MagicPrompt-1MDataset-leonidkulyk
魔法提示生成数据集MagicPrompt-1MDataset-leonidkulyk 数据来源:互联网公开数据 标签:自然语言处理,提示工程,数据集,人工智能,语言模型,机器学习,文本生成,深度学习 数据概述: 该数据集包含来自多个来源的文本数据,记录了用于生成魔法提示的文本样本。主要特征如下: 时间跨度:数据记录的时间范围为最近一年。... -
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba
英语写作水平评估与文本特征数据集EnglishWritingSkillAssessmentandTextFeatureDataset-hoangtranba 数据来源:互联网公开数据 标签:英语写作, 文本分析, 可读性评估, 写作质量, 自然语言处理, 机器学习, 文本特征, 语言模型 数据概述:... -
科学考试因果关系语言模型奖励建模数据集-kashiwaba
科学考试因果关系语言模型奖励建模数据集-kashiwaba 数据来源:互联网公开数据 标签:语言模型,因果关系,考试,奖励建模,自然语言处理,数据集,人工智能,教育 数据概述: 该数据集是用于训练和评估科学考试中因果关系理解的语言模型,并进行奖励建模的数据集。主要特征如下: 时间跨度:数据涵盖了不同年份和版本的科学考试题目。... -
英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg
英语文本重述与改写数据集EnglishParaphraseandRewritingDataset-terrychanorg 数据来源:互联网公开数据 标签:自然语言处理,文本改写,机器学习,数据集,语言模型,文本生成,语义分析,人工智能 数据概述:... -
大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis
大规模语言模型预训练数据集LLM-pretrainedDataset-afthesis 数据来源:互联网公开数据 标签:自然语言处理,大规模语言模型,预训练,数据集,文本数据,深度学习,语言模型,人工智能 数据概述: 该数据集包含了用于大规模语言模型(LLM)预训练的文本数据,旨在为模型提供丰富的语言知识和上下文理解能力。主要特征如下: 时间跨度:... -
金融指令数据集SujetoFinanceInstructDataset-tnglmng
金融指令数据集SujetoFinanceInstructDataset-tnglmng 数据来源:互联网公开数据 标签:金融,自然语言处理,指令数据,机器学习,数据集,文本分析,深度学习,语言模型 数据概述: 该数据集包含来自金融领域的指令数据,记录了金融场景中的各种指令和任务描述。主要特征如下:... -
通用语料库数据集CorpusDataset-cthitrn
通用语料库数据集CorpusDataset-cthitrn 数据来源:互联网公开数据 标签:语料库,自然语言处理,数据集,文本分析,机器学习,数据挖掘,语言模型,文本分类 数据概述: 该数据集包含来自多种来源的文本数据,记录了不同领域的语言表达。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco
大型语言模型基础对话数据集LLMsBasicConversationDataset-danvictorlofranco 数据来源:互联网公开数据 标签:自然语言处理,对话系统,数据集,机器学习,人工智能,语言模型,文本生成,智能客服 数据概述: 该数据集包含来自大型语言模型基础对话训练的数据,记录了模型与用户之间的对话交互内容。主要特征如下:... -
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck
科勒里奇预处理文本数据集ColeridgeProcessedTextDataset-peaceduck 数据来源:互联网公开数据 标签:文本处理,数据集,自然语言处理,机器学习,文本分析,语言模型,数据处理,学术研究 数据概述:该数据集包含来自科勒里奇项目(Coleridge... -
语言模型参数权重数据集LanguageModelParameterWeightDataset-llf4puppy
语言模型参数权重数据集LanguageModelParameterWeightDataset-llf4puppy 数据来源:互联网公开数据 标签:自然语言处理,深度学习,机器学习,数据集,模型训练,神经网络,人工智能,语言模型 数据概述:... -
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen
维基文本清洗数据集第二部分WikitextCleanDataPart2Dataset-yingpengchen 数据来源:互联网公开数据 标签:自然语言处理,文本数据,数据集,文本清洗,机器学习,语言模型,信息检索,文本分析 数据概述: 该数据集是维基文本清洗数据集的第二部分,包含了从维基百科中提取和清洗过的文本数据。主要特征如下:... -
人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad
人工智能生成文本预处理数据集AI-GeneratedTextPreprocessedDataset-arcfahad 数据来源:互联网公开数据 标签:人工智能,自然语言处理,文本生成,数据集,机器学习,文本预处理,语言模型,算法研究 数据概述: 该数据集包含经过预处理的由人工智能生成的文本数据,记录了多种类型和风格的文本内容。主要特征如下:... -
文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou
文本风格转换提示数据集TextStyleTransferPromptDataset-yuanzhezhou 数据来源:互联网公开数据 标签:文本生成, 风格迁移, 提示工程, 自然语言处理, 文本编辑, 语料库, 语言模型, 机器学习 数据概述:... -
Transformer模型翻译数据集iTransformerDataset-tylerfarnan
Transformer模型翻译数据集iTransformerDataset-tylerfarnan 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,Transformer,文本处理,语言模型,深度学习,翻译质量 数据概述:... -
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay
英语写作质量评估数据集EnglishWritingQualityAssessment-hasanbasriakcay 数据来源:互联网公开数据 标签:文本分析, 写作评估, 自然语言处理, 可读性分析, 语言模型, 机器学习, 文本特征, 写作质量 数据概述: 该数据集包含来自不同来源的英语写作文本,记录了用于评估英语写作质量的各项指标。主要特征如下:... -
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002
计算重用-词句银行数据集RecomputeUsingWord-SentBankDataset-minhhieu002 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,计算重用,语义理解,人工智能 数据概述: 该数据集包含来自词句银行(Word-Sent... -
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan
文本嵌入数据集ClipTextEmbeddingsDataset-ishaaaaan 数据来源:互联网公开数据 标签:文本嵌入,深度学习,自然语言处理,数据集,机器学习,人工智能,文本分析,语言模型 数据概述:该数据集包含来自CLIP(Contrastive Language-Image Pre-... -
阅读理解数据集ReadingComprehensionDatasets-parthplc
阅读理解数据集ReadingComprehensionDatasets-parthplc 数据来源:互联网公开数据 标签:阅读理解, 自然语言处理, 文本分析, 问答系统, 机器阅读, 文本挖掘, 数据集, 语言模型 数据概述: 该数据集包含来自多个公开阅读理解项目的数据,旨在评估和训练模型在理解文本、回答问题以及进行推理方面的能力。主要特征如下:... -
土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19
土耳其语文本分类数据集TurkishTextCategorizationDataset-semihaydin19 数据来源:互联网公开数据 标签:文本分类, 土耳其语, 语料库, 自然语言处理, 机器学习, 文本嵌入, 语言模型, 类别标注 数据概述: 该数据集包含来自不同来源的土耳其语文本,记录了用于文本分类任务的句子及对应的类别信息。主要特征如下:... -
机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku
机器翻译与反译数据集JigsawBackTranslatedDatasetEncodedSeq192-linshokaku 数据来源:互联网公开数据 标签:机器翻译,反译,数据集,自然语言处理,深度学习,文本编码,语言模型,数据增强 数据概述:...