找到11,983个数据集

标签: 自然语言处理

过滤结果
  • 最终年度项目FYP论文数据集-ahtishamali05

    2025年4月22日   

    最终年度项目FYP论文数据集-ahtishamali05 数据来源:互联网公开数据 标签:毕业设计,学术论文,自然语言处理,文本分析,机器学习,文本挖掘,文献综述,学术研究 数据概述: 该数据集包含来自最终年度项目(FYP)的论文,记录了学生在不同学科领域的研究成果。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 标签文件数据集LabelsFileDataset-phamdongdongk16hcm

    2025年4月22日   

    标签文件数据集LabelsFileDataset-phamdongdongk16hcm 数据来源:互联网公开数据 标签:数据标注,数据集,机器学习,图像识别,自然语言处理,数据管理,数据科学,人工智能 数据概述: 该数据集包含来自多个来源的标签文件数据,记录了用于机器学习和人工智能模型的标注信息。主要特征如下:...
    packageimg
  • 自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb

    2025年4月22日   

    自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,深度学习,神经网络,文本处理,语言模型,翻译模型 数据概述:...
    packageimg
  • 推特文本分析与机器学习数据集TwitterDatasetsforNLPandMachineLearning-aviralmishra1998

    2025年4月22日   

    推特文本分析与机器学习数据集TwitterDatasetsforNLPandMachineLearning-aviralmishra1998 数据来源:互联网公开数据 标签:推特,社交媒体,文本分析,自然语言处理,机器学习,情感分析,话题检测,数据集 数据概述:...
    packageimg
  • 词性标注数据集POSTaggingDataset-hiuanh

    2025年4月22日   

    词性标注数据集POSTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:自然语言处理,词性标注,数据集,文本分析,机器学习,语言模型,文本挖掘,计算机语言学 数据概述: 该数据集专注于词性标注任务,包含大量文本样本及其对应的词性标签。主要特征如下: 时间跨度:数据记录的时间范围未明确,但数据集内容通常反映通用语言特征。...
    packageimg
  • 新闻组文本分类数据集20NewsgroupsDataset-aniket13r

    2025年4月22日   

    新闻组文本分类数据集20NewsgroupsDataset-aniket13r 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,新闻,文本分析,主题建模,信息检索 数据概述: 该数据集包含了大约20,000篇新闻组文档,涵盖了20个不同的新闻组主题。主要特征如下: 时间跨度:数据收集的时间范围大约在1990年代初期。...
    packageimg
  • Netflix评论情感分析数据集NetflixReviewsSentimentDataset-parthbatra

    2025年4月22日   

    Netflix评论情感分析数据集NetflixReviewsSentimentDataset-parthbatra 数据来源:互联网公开数据 标签:情感分析,Netflix,评论,数据集,自然语言处理,文本分析,机器学习,用户行为 数据概述: 该数据集包含来自 Netflix 用户的评论数据,并标注了情感极性。主要特征如下:...
    packageimg
  • 搞笑段子数据集CombinedGoodJokesDataset-ihdufxr2024

    2025年4月22日   

    搞笑段子数据集CombinedGoodJokesDataset-ihdufxr2024 数据来源:互联网公开数据 标签:幽默,段子,笑话,数据集,自然语言处理,文本分析,情感分析,娱乐 数据概述: 该数据集包含了来自多个来源的搞笑段子,旨在提供一个用于文本分析和自然语言处理的资源。主要特征如下:...
    packageimg
  • YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee

    2025年4月22日   

    YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,垃圾评论,机器学习,自然语言处理,文本分类,信息过滤 数据概述:...
    packageimg
  • 阿拉伯语推特情感数据集阿拉伯语推特情感数据集-mohamedelashry74

    2025年4月22日   

    阿拉伯语推特情感数据集阿拉伯语推特情感数据集-mohamedelashry74 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,阿拉伯语,社交媒体研究 数据概述: 该数据集包含来自推特的阿拉伯语文本数据,记录了用户发布的推文及其对应的情感标签。主要特征如下:...
    packageimg
  • 银行业务问题分类数据集BankingTransactionsQuestionClassificationDataset-abhaygotmare

    2025年4月22日   

    银行业务问题分类数据集BankingTransactionsQuestionClassificationDataset-abhaygotmare 数据来源:互联网公开数据 标签:银行业务,问题分类,数据集,自然语言处理,机器学习,客户服务,金融分析,客户支持...
    packageimg
  • 医疗问答自然语言处理数据集MedQuadNLPDataset-dibyasankhapal

    2025年4月22日   

    医疗问答自然语言处理数据集MedQuadNLPDataset-dibyasankhapal 数据来源:互联网公开数据 标签:医疗问答,自然语言处理,数据集,机器学习,医学信息,健康咨询,文本分析,人工智能 数据概述: 该数据集包含来自医疗问答平台的数据,记录了用户与医疗专家之间的交互问答,适用于自然语言处理,医疗信息提取等任务。主要特征如下:...
    packageimg
  • 推特PfizerCOVID-19疫苗公众情绪分析数据集-2021-gallo33henrique

    2025年4月22日   

    推特PfizerCOVID-19疫苗公众情绪分析数据集-2021-gallo33henrique 数据来源:互联网公开数据 标签:推特, Pfizer, COVID-19, 疫苗, 公众情绪, 情感分析, 数据科学, 自然语言处理 数据概述: 本数据集包含从Twitter收集的与Pfizer...
    packageimg
  • 十大说唱歌手作品文本分析数据集-2023-ngxdtv

    2025年4月22日   

    十大说唱歌手作品文本分析数据集-2023-ngxdtv 数据来源:互联网公开数据 标签:说唱音乐,文本分析,自然语言处理,机器学习,文本分类,情感分析,主题建模,文本生成,语言模型,语音识别 数据概述: 本数据集包含超过2600首由十个不同说唱歌手创作的作品文本,其中包括Ali As、Alligatoah、Kollegah和Kool...
    packageimg
  • Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea

    2025年4月22日   

    Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea 数据来源:互联网公开数据 标签:Medium,应用评论,用户反馈,情感分析,订阅,内容,界面,用户体验,roBERTa,自然语言处理,文本分类 数据概述: 本数据集包含了从Google...
    packageimg
  • 电子邮件垃圾邮件分类数据集EmailHamSpamDataset-hamedetezadi

    2025年4月22日   

    电子邮件垃圾邮件分类数据集EmailHamSpamDataset-hamedetezadi 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,数据集,分类算法,机器学习,文本分析,自然语言处理,数据挖掘 数据概述: 该数据集包含来自电子邮件系统的邮件数据,记录了邮件内容及其分类标签(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 印度孟加拉语自由诗歌数据集2021-truthr

    2025年4月22日   

    印度孟加拉语自由诗歌数据集2021-truthr 数据来源:互联网公开数据 标签:孟加拉语,诗歌,数据集,免费资源,自然语言处理,文本生成,预训练模型,下游任务,CC-BY-SA 4.0 数据概述:...
    packageimg
  • 达拉兹电商平台商品标注标准化数据集-ahtshamrao

    2025年4月22日   

    达拉兹电商平台商品标注标准化数据集-ahtshamrao 数据来源:互联网公开数据 标签:电商,商品,标注,数据集,自然语言处理,文本分类,机器学习,商品推荐 数据概述: 该数据集包含了来自达拉兹(Daraz)电商平台的商品数据,这些数据经过了标准化处理和人工标注,主要记录了商品的基本信息和详细描述。主要特征如下:...
    packageimg
  • 阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889

    2025年4月22日   

    阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,数据集,文本分析,机器翻译,语言模型,文本语料库,语言学 数据概述: 该数据集包含超过70万条阿拉伯语句子,旨在为自然语言处理(NLP)任务提供丰富的文本语料库。主要特征如下:...
    packageimg
  • Reddit笑话数据集RedditJokesDataset-vishnuprksh

    2025年4月22日   

    Reddit笑话数据集RedditJokesDataset-vishnuprksh 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,自然语言处理,情感分析,社交媒体,机器学习,幽默 数据概述: 该数据集包含来自Reddit平台的笑话数据,记录了用户发布的各种类型的笑话及其相关信息。主要特征如下:...
    packageimg