找到11,987个数据集

标签: 自然语言处理

过滤结果
  • 亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55

    2025年4月23日   

    亚马逊商品评论数据集AmazonProductReviewDataset-mohamedmahmoud55 数据来源:互联网公开数据 标签:商品评论,数据集,电子商务,自然语言处理,消费者行为,市场分析,用户反馈,文本挖掘 数据概述:该数据集包含来自亚马逊平台的商品评论数据,记录了用户对各种商品的评价。主要特征如下:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal

    2025年4月23日   

    垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据,记录了电子邮件的文本内容和分类标签。主要特征如下:...
    packageimg
  • 数据2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu

    2025年4月23日   

    2019冠状病毒病COVID-19文本检索数据集TRECCOVIDRound1Dataset-xhlulu 数据来源:互联网公开数据 标签:文本检索,COVID-19,数据集,信息检索,自然语言处理,机器学习,数据挖掘,公共卫生 数据概述:...
    packageimg
  • 汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29

    2025年4月23日   

    汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。...
    packageimg
  • 僧伽罗语新闻标题数据集-nawarathnadeshan

    2025年4月23日   

    僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。...
    packageimg
  • 数据2021年T20世界杯推文数据集-shahidkhan1

    2025年4月23日   

    2021年T20世界杯推文数据集-shahidkhan1 数据来源:互联网公开数据 标签:推文数据,板球,T20世界杯,社交媒体分析,情感分析,自然语言处理,体育,数据集 数据概述: 该数据集包含了来自2021年T20世界杯期间的推文数据,记录了全球用户在社交媒体上关于赛事讨论的各种信息。主要特征如下:...
    packageimg
  • 新冠后低自尊关键词推文数据集10000TweetsofKeywordLowSelfEsteemPostCovidDataset-kareemrasheed89

    2025年4月23日   

    新冠后低自尊关键词推文数据集10000TweetsofKeywordLowSelfEsteemPostCovidDataset-kareemrasheed89 数据来源:互联网公开数据 标签:社交媒体,心理健康,推文分析,情绪研究,自然语言处理,疫情后,大数据,情感分析 数据概述:...
    packageimg
  • 电子邮件垃圾邮件分类数据集EmailSpamClassifierDataset-prasaddablikar

    2025年4月23日   

    电子邮件垃圾邮件分类数据集EmailSpamClassifierDataset-prasaddablikar 数据来源:互联网公开数据 标签:垃圾邮件,分类,数据集,机器学习,自然语言处理,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自互联网公开渠道的电子邮件数据,记录了电子邮件的文本内容及其分类标签(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98

    2025年4月23日   

    虚假新闻检测数据集FakeNewsDetectionDataset-bipulnath98 数据来源:互联网公开数据 标签:虚假新闻,数据集,自然语言处理,机器学习,文本分析,信息检索,事实核查,新闻传播 数据概述: 该数据集包含用于虚假新闻检测的文本数据,记录了真实新闻和虚假新闻的文本内容。主要特征如下: 时间跨度:...
    packageimg
  • 电商商品评论情感分析数据集BinSentimentDataset-pranjaldub1999

    2025年4月23日   

    电商商品评论情感分析数据集BinSentimentDataset-pranjaldub1999 数据来源:互联网公开数据 标签:电商评论,情感分析,数据集,自然语言处理,机器学习,消费者行为,市场研究,数据分析 数据概述: 该数据集包含来自电商平台的商品评论数据,记录了用户对商品的评价及其对应的情感标签,适用于情感分析和自然语言处理任务。主要特征如下:...
    packageimg
  • 循环神经网络桥梁数据集RNNBridgeDataset-twoone

    2025年4月23日   

    循环神经网络桥梁数据集RNNBridgeDataset-twoone 数据来源:互联网公开数据 标签:循环神经网络,数据集,机器学习,神经网络,时间序列,序列建模,深度学习,自然语言处理 数据概述: 该数据集专注于循环神经网络(RNN)在桥梁结构健康监测中的应用,记录了桥梁在不同负载和条件下的传感器数据。主要特征如下:...
    packageimg
  • 多标签文本分类数据集-bimleshkumar759

    2025年4月23日   

    多标签文本分类数据集-bimleshkumar759 数据来源:互联网公开数据 标签:文本分类,多标签,数据集,机器学习,自然语言处理,文本分析,深度学习,NLP 数据概述: 该数据集包含用于多标签文本分类任务的文本数据。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始数据来源。 地理范围: 数据覆盖范围不固定,取决于原始数据来源。...
    packageimg
  • 新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem

    2025年4月23日   

    新闻文章分类数据集NewsArticleCategoriesDataset-mrfaheem 数据来源:互联网公开数据 标签:新闻,文章分类,数据集,文本分析,机器学习,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的文章数据,记录了不同类别的新闻文章内容及其分类标签。主要特征如下:...
    packageimg
  • WorldStar视频评论数据集WorldStarCommentsDataset-dataranch

    2025年4月23日   

    WorldStar视频评论数据集WorldStarCommentsDataset-dataranch 数据来源:互联网公开数据 标签:视频评论,社交媒体,文本分析,情感分析,自然语言处理,数据集,舆情分析,用户行为 数据概述: 该数据集包含了来自WorldStarHipHop网站的视频评论数据,记录了用户对各类视频的评论内容。主要特征如下:...
    packageimg
  • 土耳其语IMDB电影评论情感分析数据集-yusufgoktas

    2025年4月23日   

    土耳其语IMDB电影评论情感分析数据集-yusufgoktas 数据来源:互联网公开数据 标签:情感分析,土耳其语,电影评论,自然语言处理,文本分类,机器学习,NLP,土耳其 数据概述: 该数据集包含了来自互联网电影数据库(IMDB)的土耳其语电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 学生成绩评估阈值数据集EvaluatingStudentWritingwithThresholdDataset-phanttan

    2025年4月23日   

    学生成绩评估阈值数据集EvaluatingStudentWritingwithThresholdDataset-phanttan 数据来源:互联网公开数据 标签:学生成绩,评估,阈值,教育,数据分析,机器学习,自然语言处理,教育技术 数据概述:该数据集包含来自多个教育机构的学生成绩评估数据,记录了学生的写作样本及相应的评估分数。主要特征如下:...
    packageimg
  • 新闻文本分类数据集-priyabratapanda

    2025年4月23日   

    新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。...
    packageimg
  • 大语言模型科学考试训练数据集AdditionalTrainDataforLLMScienceExam-zhiqingfang

    2025年4月23日   

    大语言模型科学考试训练数据集AdditionalTrainDataforLLMScienceExam-zhiqingfang 数据来源:互联网公开数据 标签:大语言模型,科学考试,训练数据,教育数据,机器学习,自然语言处理,学术研究,数据集 数据概述:该数据集包含用于训练大语言模型的科学考试相关数据,记录了各类科学考试的题目和答案等信息。主要特征如下:...
    packageimg
  • 地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr

    2025年4月23日   

    地理位置提及识别数据集ZindiLocationMentionRecognitionDataset-tanhtr 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,位置识别,机器学习,信息提取,地理信息系统,命名实体识别 数据概述: 该数据集由Zindi平台提供,专注于识别文本中提及的地理位置信息。主要特征如下:...
    packageimg
  • 手语识别数据集SignLanguageRecognitionDataset-emmading2008

    2025年4月23日   

    手语识别数据集SignLanguageRecognitionDataset-emmading2008 数据来源:互联网公开数据 标签:手语,数据集,图像识别,机器学习,计算机视觉,自然语言处理,人工智能,无障碍沟通 数据概述: 该数据集包含手语图像数据,用于手语识别和翻译。主要特征如下: 时间跨度:数据记录时间不限。...
    packageimg