-
UIT问答数据集UITQADataset-callmelee117
UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:... -
多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc
多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc 数据来源:互联网公开数据 标签:机器翻译,文本转换,多任务学习,数据集,自然语言处理,深度学习,人工智能,语言模型 数据概述: 该数据集由MT5(Multitask Translation Transformer)项目提供,专注于多任务翻译和文本转换任务。主要特征如下:... -
文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban
文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban 数据来源:互联网公开数据 标签:自然语言处理, 文本标注, 数据集, 机器学习, 深度学习, 语义分析, 语言模型, 计算语言学 数据概述: 该数据集包含来自公开语料库的文本数据,记录了经过人工标注的文本标签信息。主要特征如下:... -
文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro
文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:... -
书籍文本错误纠正数据集-shuaibing
书籍文本错误纠正数据集-shuaibing 数据来源:互联网公开数据 标签:文本纠错,自然语言处理,数据集,机器学习,文本校对,语言模型,文本处理,错误检测 数据概述: 该数据集包含书籍文本及其对应的校正后文本,用于训练和评估文本错误纠正模型。主要特征如下: 时间跨度:数据记录的时间跨度涵盖了不同时期出版的书籍。... -
英语与印地语混合语料数据集HinglishDataset-saahir2629
英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:... -
高棉语文本数据集KhmerTextDataset123-layacheadeth
高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。... -
GPT-2模型训练数据集EP2-LR8e5-blackitten13
GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)... -
自然语言处理项目数据集DatasetforNLPProject-namang04
自然语言处理项目数据集DatasetforNLPProject-namang04 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,深度学习,语言模型,情感分析,文本分类 数据概述: 该数据集为自然语言处理项目设计,记录了多种文本数据,适用于文本分类,情感分析,语言模型训练等任务。主要特征如下:... -
ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci
ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,社交媒体,推文,机器学习,文本分析,情感分析,语言模型,人工智能... -
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:... -
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源:互联网公开数据 标签:自然语言处理,训练脚本,数据集,机器学习,文本分析,语言模型,人工智能,深度学习 数据概述: 该数据集包含用于自然语言处理(NLP)任务的训练脚本和数据,主要服务于语言模型的训练和优化。主要特征如下:... -
自然语言处理与文本分析英文数据集NLTKEnglishCoreWebSmallDataset-fernandosr85
自然语言处理与文本分析英文数据集NLTKEnglishCoreWebSmallDataset-fernandosr85 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,英文文本,语法分析,语义理解 数据概述: 该数据集来源于NLTK(Natural Language... -
电影对话文本数据集MovieDialogTextDataset-jaafarhabibi
电影对话文本数据集MovieDialogTextDataset-jaafarhabibi 数据来源:互联网公开数据 标签:电影,对话,数据集,自然语言处理,文本分析,人工智能,情感分析,语言模型 数据概述:该数据集包含来自多部电影的对话文本数据,记录了电影中的对话内容及部分相关元信息。主要特征如下:... -
HuggingFace预训练模型数据集BERT-xenxiou
HuggingFace预训练模型数据集BERT-xenxiou 数据来源:互联网公开数据 标签:自然语言处理,数据集,预训练模型,BERT,文本分析,机器学习,语言模型,Transformer 数据概述: 该数据集包含了Hugging Face平台提供的用于预训练BERT模型的数据集。主要特征如下:... -
词嵌入训练数据集-akalyasubramanian
词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:... -
自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss
自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,数据集,XLM-R,文本分类,深度学习,机器学习,语言模型 数据概述: 该数据集专注于自然语言处理中的多分类任务,采用了XLM-R(跨语言语言模型)进行文本分类。主要特征如下:... -
Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari
Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本生成,数据集,Qlora,T5模型,OpenOrca,语言模型 数据概述: 该数据集用于训练Qlora-T5模型,整合了OpenOrca数据集。主要特征如下: 时间跨度:... -
自然语言处理NLP实践数据集-north151
自然语言处理NLP实践数据集-north151 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本数据,机器学习,语言模型,文本分类,情感分析,信息抽取,数据集 数据概述: 该数据集包含用于自然语言处理(NLP)实践的文本数据,主要用于训练和评估NLP模型。主要特征如下: 时间跨度:数据无明确时间范围,涵盖多种文本数据类型。... -
自然语言处理文件数据集NLPFilesDataset-germanarley
自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,语义分析,文本分类,人工智能 数据概述: 该数据集包含来自多个公开来源的自然语言处理相关文本文件,记录了不同类型的文本数据。主要特征如下:...