-
英语与印地语混合语料数据集HinglishDataset-saahir2629
英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源:互联网公开数据 标签:语言研究,自然语言处理,数据集,双语语料,机器学习,语言模型,社会语言学,计算机科学 数据概述: 该数据集包含英语与印地语混合使用的文本数据,记录了在社交媒体,在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下:... -
高棉语文本数据集KhmerTextDataset123-layacheadeth
高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源:互联网公开数据 标签:自然语言处理,文本分析,高棉语,机器学习,语言模型,数据集,多语言处理,文本分类 数据概述: 该数据集包含来自互联网的高棉语文本数据,记录了高棉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。... -
GPT-2模型训练数据集EP2-LR8e5-blackitten13
GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,GPT-2,机器学习,模型训练,语言模型,文本分析 数据概述: 该数据集用于训练 GPT-2 模型,由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)... -
自然语言处理项目数据集DatasetforNLPProject-namang04
自然语言处理项目数据集DatasetforNLPProject-namang04 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,深度学习,语言模型,情感分析,文本分类 数据概述: 该数据集为自然语言处理项目设计,记录了多种文本数据,适用于文本分类,情感分析,语言模型训练等任务。主要特征如下:... -
ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci
ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci 数据来源:互联网公开数据 标签:自然语言处理,社交媒体,推文,机器学习,文本分析,情感分析,语言模型,人工智能... -
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani
孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源:互联网公开数据 标签:新闻分析,数据集,文本挖掘,自然语言处理,机器学习,媒体研究,新闻分类,语言模型 数据概述: 该数据集包含来自孟加拉国新闻媒体的新闻标题数据,记录了新闻标题的文本内容。主要特征如下:... -
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192
自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源:互联网公开数据 标签:自然语言处理,训练脚本,数据集,机器学习,文本分析,语言模型,人工智能,深度学习 数据概述: 该数据集包含用于自然语言处理(NLP)任务的训练脚本和数据,主要服务于语言模型的训练和优化。主要特征如下:... -
自然语言处理与文本分析英文数据集NLTKEnglishCoreWebSmallDataset-fernandosr85
自然语言处理与文本分析英文数据集NLTKEnglishCoreWebSmallDataset-fernandosr85 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,英文文本,语法分析,语义理解 数据概述: 该数据集来源于NLTK(Natural Language... -
电影对话文本数据集MovieDialogTextDataset-jaafarhabibi
电影对话文本数据集MovieDialogTextDataset-jaafarhabibi 数据来源:互联网公开数据 标签:电影,对话,数据集,自然语言处理,文本分析,人工智能,情感分析,语言模型 数据概述:该数据集包含来自多部电影的对话文本数据,记录了电影中的对话内容及部分相关元信息。主要特征如下:... -
HuggingFace预训练模型数据集BERT-xenxiou
HuggingFace预训练模型数据集BERT-xenxiou 数据来源:互联网公开数据 标签:自然语言处理,数据集,预训练模型,BERT,文本分析,机器学习,语言模型,Transformer 数据概述: 该数据集包含了Hugging Face平台提供的用于预训练BERT模型的数据集。主要特征如下:... -
词嵌入训练数据集-akalyasubramanian
词嵌入训练数据集-akalyasubramanian 数据来源:互联网公开数据 标签:自然语言处理,词嵌入,数据集,文本分析,机器学习,语义分析,文本挖掘,语言模型 数据概述: 该数据集包含用于训练词嵌入模型的大量文本数据,主要用于学习词语的语义表示。主要特征如下: 时间跨度: 数据记录的时间范围不限,涵盖了不同历史时期的文本数据。 地理范围:... -
自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss
自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类,数据集,XLM-R,文本分类,深度学习,机器学习,语言模型 数据概述: 该数据集专注于自然语言处理中的多分类任务,采用了XLM-R(跨语言语言模型)进行文本分类。主要特征如下:... -
Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari
Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari 数据来源:互联网公开数据 标签:自然语言处理,机器学习,文本生成,数据集,Qlora,T5模型,OpenOrca,语言模型 数据概述: 该数据集用于训练Qlora-T5模型,整合了OpenOrca数据集。主要特征如下: 时间跨度:... -
自然语言处理NLP实践数据集-north151
自然语言处理NLP实践数据集-north151 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本数据,机器学习,语言模型,文本分类,情感分析,信息抽取,数据集 数据概述: 该数据集包含用于自然语言处理(NLP)实践的文本数据,主要用于训练和评估NLP模型。主要特征如下: 时间跨度:数据无明确时间范围,涵盖多种文本数据类型。... -
自然语言处理文件数据集NLPFilesDataset-germanarley
自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语言模型,语义分析,文本分类,人工智能 数据概述: 该数据集包含来自多个公开来源的自然语言处理相关文本文件,记录了不同类型的文本数据。主要特征如下:... -
AST-SQL数据集AST-SQLDataset-youssefhazemfarouk
AST-SQL数据集AST-SQLDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:自然语言处理,SQL生成,数据集,机器学习,数据库,文本分析,语言模型,数据查询 数据概述: 该数据集专注于自然语言到SQL的转换任务,记录了如何将自然语言查询语句转换为相应的SQL查询语句。主要特征如下:... -
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa
英法机器翻译数据集EnglishtoFrenchMachineTranslationDataset-arvindvasa 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,语言学,人工智能,文本分析,翻译技术,语言模型 数据概述:该数据集提供了英法翻译任务中使用的文本数据,记录了大量英文与对应法文的翻译对。主要特征如下:... -
英语写作关联特征训练数据集-kentakikuhi
英语写作关联特征训练数据集-kentakikuhi 数据来源:互联网公开数据 标签:英语写作,数据集,自然语言处理,文本分析,机器学习,语言模型,写作质量,关联特征 数据概述: 该数据集包含了用于训练英语写作关联特征的数据,旨在提升写作质量和理解写作模式。主要特征如下: 时间跨度:数据没有明确的时间跨度,但通常涵盖现代英语写作。... -
社交媒体评论反讽检测数据集DetectSarcasminCommentsDataset-sachinichake
社交媒体评论反讽检测数据集DetectSarcasminCommentsDataset-sachinichake 数据来源:互联网公开数据 标签:自然语言处理,情感分析,反讽检测,数据集,机器学习,文本分类,社交媒体,语言模型 数据概述: 该数据集包含来自社交媒体平台的用户评论数据,专注于识别和检测评论中的反讽内容。主要特征如下:... -
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance...