数据集 - 海数据

UIT问答数据集UITQADataset-callmelee117

2025年4月26日

UIT问答数据集UITQADataset-callmelee117 数据来源：互联网公开数据标签：问答系统，自然语言处理，数据集，文本分类，机器学习，智能对话，语言模型，人工智能数据概述：该数据集来自UIT问答系统项目，记录了用户提出的问题和对应的答案，适用于问答系统开发，文本分类和智能对话研究。主要特征如下：...

ZIP

多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc

2025年4月26日

多任务翻译与文本转换数据集MT5ManualDatasetD2D-parthplc 数据来源：互联网公开数据标签：机器翻译，文本转换，多任务学习，数据集，自然语言处理，深度学习，人工智能，语言模型数据概述：该数据集由MT5（Multitask Translation Transformer）项目提供，专注于多任务翻译和文本转换任务。主要特征如下：...

ZIP

文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban

2025年4月26日

文本标签标注数据集Corpus-Tag-Final-1TextLabelingDataset-muhammadhusban 数据来源：互联网公开数据标签：自然语言处理，文本标注，数据集，机器学习，深度学习，语义分析，语言模型，计算语言学数据概述：该数据集包含来自公开语料库的文本数据，记录了经过人工标注的文本标签信息。主要特征如下：...

ZIP

文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro

2025年4月26日

文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源：互联网公开数据标签：文本分类，数据集，自然语言处理，机器学习，深度学习，预训练模型，语言模型，模型微调数据概述：...

ZIP

书籍文本错误纠正数据集-shuaibing

2025年4月26日

书籍文本错误纠正数据集-shuaibing 数据来源：互联网公开数据标签：文本纠错，自然语言处理，数据集，机器学习，文本校对，语言模型，文本处理，错误检测数据概述：该数据集包含书籍文本及其对应的校正后文本，用于训练和评估文本错误纠正模型。主要特征如下：时间跨度：数据记录的时间跨度涵盖了不同时期出版的书籍。...

ZIP

英语与印地语混合语料数据集HinglishDataset-saahir2629

2025年4月26日

英语与印地语混合语料数据集HinglishDataset-saahir2629 数据来源：互联网公开数据标签：语言研究，自然语言处理，数据集，双语语料，机器学习，语言模型，社会语言学，计算机科学数据概述：该数据集包含英语与印地语混合使用的文本数据，记录了在社交媒体，在线聊天和日常交流中广泛使用的Hinglish语言现象。主要特征如下：...

ZIP

高棉语文本数据集KhmerTextDataset123-layacheadeth

2025年4月26日

高棉语文本数据集KhmerTextDataset123-layacheadeth 数据来源：互联网公开数据标签：自然语言处理，文本分析，高棉语，机器学习，语言模型，数据集，多语言处理，文本分类数据概述：该数据集包含来自互联网的高棉语文本数据，记录了高棉语的文本内容。主要特征如下：时间跨度：数据记录的时间范围未明确说明。...

ZIP

GPT-2模型训练数据集EP2-LR8e5-blackitten13

2025年4月26日

GPT-2模型训练数据集EP2-LR8e5-blackitten13 数据来源：互联网公开数据标签：自然语言处理，文本生成，数据集，GPT-2，机器学习，模型训练，语言模型，文本分析数据概述：该数据集用于训练 GPT-2 模型，由 EP2 (Epoch 2) 和 LR8e5 (Learning Rate 8e-5)...

ZIP

自然语言处理项目数据集DatasetforNLPProject-namang04

2025年4月26日

自然语言处理项目数据集DatasetforNLPProject-namang04 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，深度学习，语言模型，情感分析，文本分类数据概述：该数据集为自然语言处理项目设计，记录了多种文本数据，适用于文本分类，情感分析，语言模型训练等任务。主要特征如下：...

ZIP

ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci

2025年4月26日

ChatGPT每日推文自然语言处理数据集ChatGPTDailyTweetsNLPDataset-esrabicakci 数据来源：互联网公开数据标签：自然语言处理，社交媒体，推文，机器学习，文本分析，情感分析，语言模型，人工智能...

ZIP

孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani

2025年4月26日

孟加拉国新闻标题数据集BangladeshNewsHeadlinesDataset-ishtyaquemikrani 数据来源：互联网公开数据标签：新闻分析，数据集，文本挖掘，自然语言处理，机器学习，媒体研究，新闻分类，语言模型数据概述：该数据集包含来自孟加拉国新闻媒体的新闻标题数据，记录了新闻标题的文本内容。主要特征如下：...

ZIP

自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192

2025年4月26日

自然语言处理训练脚本数据集NLPTrainScriptDataset-hertz192 数据来源：互联网公开数据标签：自然语言处理，训练脚本，数据集，机器学习，文本分析，语言模型，人工智能，深度学习数据概述：该数据集包含用于自然语言处理（NLP）任务的训练脚本和数据，主要服务于语言模型的训练和优化。主要特征如下：...

ZIP

自然语言处理与文本分析英文数据集NLTKEnglishCoreWebSmallDataset-fernandosr85

2025年4月26日

自然语言处理与文本分析英文数据集NLTKEnglishCoreWebSmallDataset-fernandosr85 数据来源：互联网公开数据标签：自然语言处理，文本分析，数据集，机器学习，语言模型，英文文本，语法分析，语义理解数据概述：该数据集来源于NLTK（Natural Language...

ZIP

电影对话文本数据集MovieDialogTextDataset-jaafarhabibi

2025年4月26日

电影对话文本数据集MovieDialogTextDataset-jaafarhabibi 数据来源：互联网公开数据标签：电影，对话，数据集，自然语言处理，文本分析，人工智能，情感分析，语言模型数据概述：该数据集包含来自多部电影的对话文本数据，记录了电影中的对话内容及部分相关元信息。主要特征如下：...

ZIP

HuggingFace预训练模型数据集BERT-xenxiou

2025年4月26日

HuggingFace预训练模型数据集BERT-xenxiou 数据来源：互联网公开数据标签：自然语言处理，数据集，预训练模型，BERT，文本分析，机器学习，语言模型，Transformer 数据概述：该数据集包含了Hugging Face平台提供的用于预训练BERT模型的数据集。主要特征如下：...

ZIP

词嵌入训练数据集-akalyasubramanian

2025年4月26日

词嵌入训练数据集-akalyasubramanian 数据来源：互联网公开数据标签：自然语言处理，词嵌入，数据集，文本分析，机器学习，语义分析，文本挖掘，语言模型数据概述：该数据集包含用于训练词嵌入模型的大量文本数据，主要用于学习词语的语义表示。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了不同历史时期的文本数据。地理范围：...

ZIP

自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss

2025年4月26日

自然语言处理多分类XLM-R数据集NLPMulticlassXLM-RDataset-aeryss 数据来源：互联网公开数据标签：自然语言处理，多分类，数据集，XLM-R，文本分类，深度学习，机器学习，语言模型数据概述：该数据集专注于自然语言处理中的多分类任务，采用了XLM-R（跨语言语言模型）进行文本分类。主要特征如下：...

ZIP

Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari

2025年4月26日

Qlora-T5模型训练数据集Qlora-T5OpenOrcaDataset-shailjakanttiwari 数据来源：互联网公开数据标签：自然语言处理，机器学习，文本生成，数据集，Qlora，T5模型，OpenOrca，语言模型数据概述：该数据集用于训练Qlora-T5模型，整合了OpenOrca数据集。主要特征如下：时间跨度：...

ZIP

自然语言处理NLP实践数据集-north151

2025年4月26日

自然语言处理NLP实践数据集-north151 数据来源：互联网公开数据标签：自然语言处理，NLP，文本数据，机器学习，语言模型，文本分类，情感分析，信息抽取，数据集数据概述：该数据集包含用于自然语言处理（NLP）实践的文本数据，主要用于训练和评估NLP模型。主要特征如下：时间跨度：数据无明确时间范围，涵盖多种文本数据类型。...

ZIP

自然语言处理文件数据集NLPFilesDataset-germanarley

2025年4月25日

自然语言处理文件数据集NLPFilesDataset-germanarley 数据来源：互联网公开数据标签：自然语言处理，文本分析，数据集，机器学习，语言模型，语义分析，文本分类，人工智能数据概述：该数据集包含来自多个公开来源的自然语言处理相关文本文件，记录了不同类型的文本数据。主要特征如下：...

ZIP

找到755个数据集

注册成功！