-
GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12
GPT-2模型微调数据集GPT-2Fine-tuneDataset-sahib12 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,语言模型,文本生成,深度学习,人工智能,模型微调 数据概述: 该数据集包含用于微调GPT-2语言模型的数据,主要记录了文本数据及其相关的标注信息。主要特征如下:... -
自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound
自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述: 该数据集用于自然语言处理的入门学习和研究,记录了多种文本数据及相应的标注信息。主要特征如下:... -
自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01
自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源:互联网公开数据 标签:自然语言处理,新闻标题,文本分析,机器学习,情感分析,文本摘要,数据集,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻标题数据,主要用于自然语言处理(NLP)相关的研究和应用。主要特征如下:... -
策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020
策略问答训练数据集StrategyQATrainDatasetwithLLMs-mahbuburrahman2020 数据来源:互联网公开数据 标签:策略问答,数据集,自然语言处理,机器学习,语言模型,训练数据,问答系统,人工智能 数据概述:该数据集包含来自StrategyQA项目的训练数据,用于策略问答系统的训练。主要特征如下:... -
大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan
大型语言模型训练原始数据集LargeLanguageModelTrainingRawDataset-wanfangyuan 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,深度学习,人工智能,语言模型,文本数据,模型训练 数据概述: 该数据集包含用于训练大型语言模型的原始文本数据,记录了多种来源的文本内容。主要特征如下:... -
学术论文文本分析数据集EssayDataset-hienbm02
学术论文文本分析数据集EssayDataset-hienbm02 数据来源:互联网公开数据 标签:文本分析,教育研究,数据集,自然语言处理,机器学习,学术写作,文献分析,语言模型 数据概述: 该数据集包含来自学术论文和学术写作的文本数据,记录了学术文献的文本内容和相关特征。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2022年。... -
生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi
生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源:互联网公开数据 标签:自然语言处理,生成式AI,数据集,机器学习,语言模型,文本生成,深度学习,人工智能 数据概述: 该数据集包含来自生成式预训练模型与大型语言模型(LLM)的研究数据,记录了模型在文本生成,语言理解等方面的表现。主要特征如下:... -
语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv
语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,教育,学生,语言模型,平等化,文本分析... -
GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri
GPT-2印尼语数据集GPT-2JavaneseDataset-lutfiandri 数据来源:互联网公开数据 标签:自然语言处理,数据集,印尼语,GPT-2,文本生成,语言模型,机器翻译,文本分析 数据概述: 该数据集包含了印尼语文本数据,旨在用于训练和评估GPT-2模型,从而提升印尼语文本生成,翻译等相关任务的性能。主要特征如下:... -
BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13
BERT-base未分大小写预训练模型第1轮数据集BERT-baseuncasedPretrainedEpoch1Dataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,BERT,机器学习,深度学习,文本分析,语言模型,人工智能 数据概述: 该数据集包含了BERT-... -
多选题与文本上下文数据集-hark99
多选题与文本上下文数据集-hark99 数据来源:互联网公开数据 标签:多选题,上下文理解,自然语言处理,数据集,文本分析,机器学习,考试,语言模型 数据概述:该数据集包含多选题及其对应的文本上下文,旨在用于研究和评估模型在理解文本和回答选择题方面的能力。主要特征如下: 时间跨度:数据收集的时间范围不限。... -
生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602
生成的字符串场景文本数据集GeneratedStringforTextScenarioDataset-sg0602 数据来源:互联网公开数据 标签:文本生成,自然语言处理,数据集,机器学习,文本分析,人工智能,语言模型,文本挖掘 数据概述: 该数据集包含来自多个公开源文本生成的数据,记录了不同场景下的文本内容和特征。主要特征如下:... -
DACON语言翻译输出数据集-geying
DACON语言翻译输出数据集-geying 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言模型,深度学习,翻译质量评估,文本分析,人工智能 数据概述: 该数据集包含来自DACON竞赛的语言翻译输出数据,主要记录了机器翻译模型对输入文本的翻译结果。主要特征如下: 时间跨度:数据记录的时间范围为比赛期间。... -
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74
HuggingFace文档数据集HuggingFaceDocumentationDataset-sanjay74 数据来源:互联网公开数据 标签:自然语言处理,数据集,文档分析,机器学习,文本处理,人工智能,语言模型,文本分类 数据概述:该数据集包含来自 Hugging Face... -
机器翻译硕士论文数据集MachineTranslationMaster-sThesisDataset-fathanalhindami
机器翻译硕士论文数据集MachineTranslationMaster-sThesisDataset-fathanalhindami 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,学术研究,文本翻译,语言模型,人工智能,教育研究 数据概述:... -
单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1
单字词频数据集UnigramFrequencyCSVDataset-abdulrahmanmuhammed1 数据来源:互联网公开数据 标签:自然语言处理,词频统计,数据集,文本分析,机器学习,语言模型,统计学,数据挖掘 数据概述: 该数据集包含来自多种文本来源的单字词频统计信息,记录了不同语言或文本中单个字的出现频率。主要特征如下:... -
数据2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber
2021反馈大赛训练数据集TrainDataFeedbackPrize2021Dataset-bobber 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,反馈分析,机器学习,写作质量评估,语言模型,教育 数据概述:... -
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki
印地语大语言模型数据生成数据集HindiLLMDataGenerationDataset-daspinaki 数据来源:互联网公开数据 标签:自然语言处理,印地语,数据集,语言模型,机器学习,文本生成,数据增强,多语言处理 数据概述: 该数据集包含用于印地语大语言模型训练和评估的数据,记录了印地语的文本生成任务所需的数据样本。主要特征如下:... -
推断语义模型训练与检测数据集InferSentTrain-DetectV2Dataset-dm4006
推断语义模型训练与检测数据集InferSentTrain-DetectV2Dataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,语义理解,数据集,深度学习,文本分类,情感分析,机器学习,语言模型 数据概述: 该数据集专为训练和检测推断语义模型(InferSent)而设计,记录了用于语义理解和推断的文本数据。主要特征如下:... -
LLM文本检测数据集-wcylxh
LLM文本检测数据集-wcylxh 数据来源:互联网公开数据 标签:自然语言处理,文本检测,数据集,机器学习,语言模型,文本分析,内容识别,风险评估 数据概述: 该数据集包含用于检测大型语言模型(LLM)生成的文本数据,旨在帮助研究人员和开发人员识别由LLM生成的文本。主要特征如下: 时间跨度:数据记录的时间范围为近期,包含最新LLM生成的内容。...