找到11,736个数据集

标签: 自然语言处理

过滤结果
  • 主题建模数据集TopicModelingDataset-quangvinhtrnh

    2025年4月23日   

    主题建模数据集TopicModelingDataset-quangvinhtrnh 数据来源:互联网公开数据 标签:主题建模,数据集,自然语言处理,文本分析,机器学习,数据挖掘,信息检索,文本挖掘 数据概述: 该数据集专注于主题建模任务,包含来自多个来源的文本数据,用于分析文本内容中的潜在主题。主要特征如下:...
    packageimg
  • 滚石杂志文章与实体识别数据集RollingStoneMagazineArticlesandEntityRecognitionDataset-derrickzhen

    2025年4月23日   

    滚石杂志文章与实体识别数据集RollingStoneMagazineArticlesandEntityRecognitionDataset-derrickzhen 数据来源:互联网公开数据 标签:媒体分析,自然语言处理,实体识别,数据集,文本挖掘,机器学习,新闻分析,内容分析 数据概述: 该数据集包含来自滚石杂志(Rolling...
    packageimg
  • 南洋理工大学垃圾邮件数据集NUSSpamDatasetCleaned-johnsonubah

    2025年4月23日   

    南洋理工大学垃圾邮件数据集NUSSpamDatasetCleaned-johnsonubah 数据来源:互联网公开数据 标签:垃圾邮件,数据集,邮件过滤,自然语言处理,机器学习,信息安全,文本分析,学术资源 数据概述:该数据集由南洋理工大学提供,主要用于垃圾邮件的识别和过滤。主要特征如下: 时间跨度:数据记录的时间范围从2002年到2004年。...
    packageimg
  • 亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro

    2025年4月23日   

    亚马逊意大利站商品评论情感分析数据集-giuseppecristofaro 数据来源:互联网公开数据 标签:亚马逊,意大利,评论,情感分析,评分,文本数据,自然语言处理,机器学习 数据概述: 本数据集包含来自亚马逊意大利站的商品评论,共计17,340条,每条评论均包含以下字段: score(评分):客户给出的评分,通常为1-5星。...
    packageimg
  • 亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55

    2025年4月23日   

    亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55 数据来源:互联网公开数据 标签:商品评论,数据集,电子商务,自然语言处理,消费者行为,市场分析,用户反馈,文本挖掘 数据概述:该数据集包含来自亚马逊平台的商品评论数据,记录了用户对各种商品的评价。主要特征如下:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal

    2025年4月23日   

    垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据,记录了电子邮件的文本内容和分类标签。主要特征如下:...
    packageimg
  • 数据2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu

    2025年4月23日   

    2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu 数据来源:互联网公开数据 标签:文本检索,COVID-19,数据集,信息检索,自然语言处理,机器学习,数据挖掘,公共卫生 数据概述:...
    packageimg
  • 汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29

    2025年4月23日   

    汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 僧伽罗语新闻标题数据集-nawarathnadeshan

    2025年4月23日   

    僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。...
    packageimg
  • 数据2021年T20世界杯推文数据集-shahidkhan1

    2025年4月23日   

    2021年T20世界杯推文数据集-shahidkhan1 数据来源:互联网公开数据 标签:推文数据,板球,T20世界杯,社交媒体分析,情感分析,自然语言处理,体育,数据集 数据概述: 该数据集包含了来自2021年T20世界杯期间的推文数据,记录了全球用户在社交媒体上关于赛事讨论的各种信息。主要特征如下:...
    packageimg
  • 新冠后低自尊关键词推文数据集10000TweetsofKeywordLowSelfEsteemPostCovidDataset-kareemrasheed89

    2025年4月23日   

    新冠后低自尊关键词推文数据集10000TweetsofKeywordLowSelfEsteemPostCovidDataset-kareemrasheed89 数据来源:互联网公开数据 标签:社交媒体,心理健康,推文分析,情绪研究,自然语言处理,疫情后,大数据,情感分析 数据概述:...
    packageimg
  • 电子邮件垃圾邮件分类数据集EmailSpamClassifierDataset-prasaddablikar

    2025年4月23日   

    电子邮件垃圾邮件分类数据集EmailSpamClassifierDataset-prasaddablikar 数据来源:互联网公开数据 标签:垃圾邮件,分类,数据集,机器学习,自然语言处理,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自互联网公开渠道的电子邮件数据,记录了电子邮件的文本内容及其分类标签(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98

    2025年4月23日   

    虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分析,信息检索,事实核查,新闻传播 数据概述: 该数据集包含用于虚假新闻检测的文本数据,记录了真实新闻和虚假新闻的文本内容。主要特征如下: 时间跨度:...
    packageimg
  • 电商商品评论情感分析数据集BinSentimentDataset-pranjaldub1999

    2025年4月23日   

    电商商品评论情感分析数据集BinSentimentDataset-pranjaldub1999 数据来源:互联网公开数据 标签:电商评论,情感分析,数据集,自然语言处理,机器学习,消费者行为,市场研究,数据分析 数据概述: 该数据集包含来自电商平台的商品评论数据,记录了用户对商品的评价及其对应的情感标签,适用于情感分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 循环神经网络桥梁数据集RNNBridgeDataset-twoone

    2025年4月23日   

    循环神经网络桥梁数据集RNNBridgeDataset-twoone 数据来源:互联网公开数据 标签:循环神经网络,数据集,机器学习,神经网络,时间序列,序列建模,深度学习,自然语言处理 数据概述: 该数据集专注于循环神经网络(RNN)在桥梁结构健康监测中的应用,记录了桥梁在不同负载和条件下的传感器数据。主要特征如下:...
    packageimg
  • 多标签文本分类数据集-bimleshkumar759

    2025年4月23日   

    多标签文本分类数据集-bimleshkumar759 数据来源:互联网公开数据 标签:文本分类,多标签,数据集,机器学习,自然语言处理,文本分析,深度学习,NLP 数据概述: 该数据集包含用于多标签文本分类任务的文本数据。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始数据来源。 地理范围: 数据覆盖范围不固定,取决于原始数据来源。...
    packageimg
  • 新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem

    2025年4月23日   

    新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem 数据来源:互联网公开数据 标签:新闻,文章分类,数据集,文本分析,机器学习,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的文章数据,记录了不同类别的新闻文章内容及其分类标签。主要特征如下:...
    packageimg
  • WorldStar视频评论数据集WorldStarCommentsDataset-dataranch

    2025年4月23日   

    WorldStar视频评论数据集WorldStarCommentsDataset-dataranch 数据来源:互联网公开数据 标签:视频评论,社交媒体,文本分析,情感分析,自然语言处理,数据集,舆情分析,用户行为 数据概述: 该数据集包含了来自WorldStarHipHop网站的视频评论数据,记录了用户对各类视频的评论内容。主要特征如下:...
    packageimg
  • 土耳其语IMDB电影评论情感分析数据集-yusufgoktas

    2025年4月23日   

    土耳其语IMDB电影评论情感分析数据集-yusufgoktas 数据来源:互联网公开数据 标签:情感分析,土耳其语,电影评论,自然语言处理,文本分类,机器学习,NLP,土耳其 数据概述: 该数据集包含了来自互联网电影数据库(IMDB)的土耳其语电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 学生成绩评估阈值数据集EvaluatingStudentWritingwithThresholdDataset-phanttan

    2025年4月23日   

    学生成绩评估阈值数据集EvaluatingStudentWritingwithThresholdDataset-phanttan 数据来源:互联网公开数据 标签:学生成绩,评估,阈值,教育,数据分析,机器学习,自然语言处理,教育技术 数据概述:该数据集包含来自多个教育机构的学生成绩评估数据,记录了学生的写作样本及相应的评估分数。主要特征如下:...
    packageimg