数据集 - 海数据

土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11

2025年4月24日

土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11 数据来源：互联网公开数据标签：垃圾邮件，电子邮件，文本分析，自然语言处理，机器学习，土耳其语，文本分类，网络安全数据概述：该数据集包含了土耳其语的电子邮件数据，用于垃圾邮件检测和分类。主要特征如下：...

ZIP

推特仇恨言论情感分析数据集-fawadawan

2025年4月24日

推特仇恨言论情感分析数据集-fawadawan 数据来源：互联网公开数据标签：推特，仇恨言论，情感分析，自然语言处理，机器学习，文本分类，社交媒体，负面情绪数据概述：该数据集包含来自推特平台的数据，记录了推文内容及相应的情感标签，主要用于仇恨言论的情感分析研究。主要特征如下：时间跨度：数据记录的时间范围未明确标注，但推文数据通常具有时效性。...

ZIP

科学BERT数据集SciBERTDataset-cse006kongkanbora

2025年4月24日

科学BERT数据集SciBERTDataset-cse006kongkanbora 数据来源：互联网公开数据标签：科学文献，自然语言处理，数据集，机器学习，深度学习，文本分类，学术研究，信息检索数据概述：该数据集包含来自多个科学文献的数据，记录了大量科学论文的摘要，文本和相关元数据。主要特征如下：...

ZIP

卡纳达语情感分析数据集-kishorsinnur

2025年4月24日

卡纳达语情感分析数据集-kishorsinnur 数据来源：互联网公开数据标签：情感分析，卡纳达语，自然语言处理，数据集，文本分类，机器学习，印度语言，语言学数据概述：该数据集包含来自各种来源的卡纳达语文本数据，用于情感分析任务。主要特征如下：时间跨度：数据记录的时间范围不明确，但包含了从近期到过去一段时间的文本数据。...

ZIP

推特情感分析数据集TweetSentimentAnalysisDataset-jiemingyou

2025年4月24日

推特情感分析数据集TweetSentimentAnalysisDataset-jiemingyou 数据来源：互联网公开数据标签：推特，情感分析，数据集，自然语言处理，机器学习，文本分类，社交媒体分析，社会学研究数据概述：该数据集包含来自推特的文本数据，记录了推文及其对应的情感标签，适用于情感分析，自然语言处理等任务。主要特征如下：...

ZIP

有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi

2025年4月24日

有毒评论分类数据集Assignment2ToxicCommentsDataset-uwugermi 数据来源：互联网公开数据标签：评论分析，数据集，机器学习，文本分类，自然语言处理，社交媒体，深度学习，语言研究数据概述：该数据集包含来自互联网上的用户评论数据，主要用于识别和分类有毒评论。主要特征如下：...

ZIP

自然语言处理实践竞赛数据集NLPinPracticeCompetitionDataset-e0xextazy

2025年4月24日

自然语言处理实践竞赛数据集NLPinPracticeCompetitionDataset-e0xextazy 数据来源：互联网公开数据标签：自然语言处理，NLP，文本分类，数据集，机器学习，竞赛，文本分析，人工智能数据概述：该数据集包含来自自然语言处理实践竞赛的数据，记录了用于文本分类任务的文本数据。主要特征如下：...

ZIP

情感分析数据集SentimentAnalysisDataset-curiouscyborgs

2025年4月24日

情感分析数据集SentimentAnalysisDataset-curiouscyborgs 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，机器学习，文本分类，数据挖掘，计算机科学，人工智能数据概述：该数据集包含来自社交媒体，评论网站等平台的结构化情感分析数据，记录了用户评论，文本内容及其对应的情感标签。主要特征如下：...

ZIP

文本分类数据集TextClassificationDataset-albellna

2025年4月24日

文本分类数据集TextClassificationDataset-albellna 数据来源：互联网公开数据标签：文本分类，自然语言处理，数据集，机器学习，文本分析，信息检索，人工智能，语言模型数据概述：该数据集包含来自多个来源的文本数据，记录了不同类别文本的样本，适用于文本分类，情感分析等应用。主要特征如下：...

ZIP

自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369

2025年4月24日

自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源：互联网公开数据标签：自然语言处理，语言检测，数据集，文本分析，机器学习，文本分类，语言学，计算机科学数据概述：该数据集包含来自多个来源的文本数据，用于自然语言处理中的语言检测任务。主要特征如下：...

ZIP

情感分析数据集Positive-Neutral-NegativeSentimentAnalysisDataset-jayeshchak

2025年4月24日

情感分析数据集Positive-Neutral-NegativeSentimentAnalysisDataset-jayeshchak 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，机器学习，文本分类，数据挖掘，人工智能，情感识别数据概述：该数据集包含来自互联网公开来源的情感分析数据，记录了文本内容的情感倾向。主要特征如下：...

ZIP

仇恨言论分类数据集HateSpeechDatasetwithClassification-rohansandipborhade

2025年4月24日

仇恨言论分类数据集HateSpeechDatasetwithClassification-rohansandipborhade 数据来源：互联网公开数据标签：仇恨言论，文本分类，自然语言处理，机器学习，情感分析，社交媒体，数据集，舆情分析数据概述：该数据集包含了来自社交媒体平台的文本数据，并标注了是否包含仇恨言论。主要特征如下：...

ZIP

自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya

2025年4月24日

自然语言处理与信息检索INLP作业3数据集INLPAssignment3Dataset-shubhamkathiriya 数据来源：互联网公开数据标签：自然语言处理，信息检索，数据集，文本分类，机器学习，深度学习，文本分析，数据挖掘数据概述：...

ZIP

有毒评论分类数据集ToxicCommentClassificationDataset-akashsuper2000

2025年4月24日

有毒评论分类数据集ToxicCommentClassificationDataset-akashsuper2000 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，机器学习，情感分析，社交网络，数据挖掘，人工智能数据概述：该数据集包含来自互联网公开平台的用户评论数据，记录了各类文本评论及其毒性分类标签。主要特征如下：...

ZIP

漫画期刊分类数据集2017-2020ClassificacaodePeriodicosQuadrinio2017-2020Dataset-pablohuascar

2025年4月24日

漫画期刊分类数据集2017-2020ClassificacaodePeriodicosQuadrinio2017-2020Dataset-pablohuascar 数据来源：互联网公开数据标签：漫画期刊，分类，数据集，出版行业，数据分析，文本分类，机器学习，文化研究数据概述：...

ZIP

斯坦福情感树数据集SST5Dataset-mercyfausty

2025年4月24日

斯坦福情感树数据集SST5Dataset-mercyfausty 数据来源：互联网公开数据标签：情感分析，自然语言处理，数据集，文本分类，深度学习，情感识别，NLP，语义分析数据概述：该数据集来自斯坦福大学，主要用于情感分析任务，包含了电影评论的细粒度情感标注。主要特征如下：时间跨度：数据记录的时间跨度不明确，但涵盖了电影评论的时间范围。...

ZIP

越南视频标题描述分类数据集VietnameseVideoTitleDescriptionClassificationDataset-hiephahoang

2025年4月24日

越南视频标题描述分类数据集VietnameseVideoTitleDescriptionClassificationDataset-hiephahoang 数据来源：互联网公开数据标签：视频分类，数据集，自然语言处理，机器学习，视频内容分析，语言模型，越南语，文本分类...

ZIP

多数据集情感分析数据集Ser-MultiDatasetforSentimentAnalysis-simonemarullo

2025年4月24日

多数据集情感分析数据集Ser-MultiDatasetforSentimentAnalysis-simonemarullo 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，文本挖掘，机器学习，深度学习，文本分类，人工智能数据概述：该数据集包含多个来源的情感分析数据，记录了不同领域的文本数据及其对应的情感标签。主要特征如下：...

ZIP

路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu

2025年4月24日

路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源：互联网公开数据标签：文本分类，新闻，自然语言处理，机器学习，数据集，信息检索，语料库，文本分析数据概述：该数据集包含来自路透社的新闻报道，主要用于文本分类任务。主要特征如下：时间跨度：数据记录的时间范围主要集中在1987年。...