数据集 - 海数据

预训练标签数据集Pred-trainTagsDataset-ananyaajoshi

2025年4月25日

预训练标签数据集Pred-trainTagsDataset-ananyaajoshi 数据来源：互联网公开数据标签：预训练，标签，数据集，自然语言处理，文本分类，信息检索，机器学习，深度学习数据概述：该数据集包含了用于预训练的标签数据，旨在支持各种自然语言处理任务，例如文本分类，信息检索等。主要特征如下：时间跨度：...

ZIP

IMDB电影评论情感分析数据集IMDBReviewsSentimentAnalysisDataset-sureshvj

2025年4月25日

IMDB电影评论情感分析数据集IMDBReviewsSentimentAnalysisDataset-sureshvj 数据来源：互联网公开数据标签：电影评论，情感分析，数据集，自然语言处理，机器学习，文本分类，数据挖掘，人工智能数据概述：...

ZIP

垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon

2025年4月25日

垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon 数据来源：互联网公开数据标签：电子邮件，垃圾邮件，数据集，文本分类，机器学习，自然语言处理，数据分析，信息安全数据概述：...

ZIP

土耳其虚假新闻数据集TurkishFakeNewsDataset-atakanak

2025年4月25日

土耳其虚假新闻数据集TurkishFakeNewsDataset-atakanak 数据来源：互联网公开数据标签：新闻分析，虚假信息，数据集，文本分类，机器学习，自然语言处理，新闻媒体，信息传播数据概述：该数据集包含来自土耳其公开新闻平台的数据，记录了土耳其新闻媒体中的虚假新闻内容及相关特征。主要特征如下：...

ZIP

IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12

2025年4月25日

IMDB电影评论情感分析数据集IMDBMoviesReviewsSentimentAnalysisDataset-fernandoalonso12 数据来源：互联网公开数据标签：电影评论，情感分析，数据集，自然语言处理，机器学习，文本分类，情感计算，大数据数据概述：...

ZIP

恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio

2025年4月25日

恐怖小说作者识别数据集SpookyAuthorsCSVDataset-gdberrio 数据来源：互联网公开数据标签：文本分类，作者识别，数据集，机器学习，自然语言处理，文学分析，数据挖掘，人工智能数据概述：该数据集包含来自三位恐怖小说作家的文本数据，主要用于作者身份识别和文本分类任务。主要特征如下：...

ZIP

土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin

2025年4月25日

土耳其新闻数据集TurkishNewsSonDNewsDataset-denizhanahin 数据来源：互联网公开数据标签：新闻分析，数据集，自然语言处理，文本分类，机器学习，新闻媒体，土耳其，多语言数据概述：该数据集包含来自土耳其知名新闻媒体Son D News的新闻文章数据，记录了该媒体发布的新闻内容。主要特征如下：...

ZIP

电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1

2025年4月25日

电影评论情感分析数据集MovieReviewsSentimentAnalysisDataset-rohanroy1 数据来源：互联网公开数据标签：电影评论，情感分析，自然语言处理，机器学习，文本分类，数据集，情感倾向，电影行业数据概述：该数据集包含来自互联网的电影评论数据，主要用于情感分析任务，旨在识别电影评论中的情感倾向。主要特征如下：...

ZIP

电子邮件垃圾邮件检测数据集-salonimourya

2025年4月25日

电子邮件垃圾邮件检测数据集-salonimourya 数据来源：互联网公开数据标签：电子邮件，垃圾邮件，数据集，文本分类，自然语言处理，机器学习，信息检索，数据挖掘数据概述：该数据集包含电子邮件数据，用于垃圾邮件检测。主要特征如下：时间跨度：数据记录的时间范围不明确，但涵盖了电子邮件产生的历史数据。...

ZIP

金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058

2025年4月25日

金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058 数据来源：互联网公开数据标签：情感分析，金融新闻，数据集，自然语言处理，机器学习，文本挖掘，金融科技，文本分类数据概述：...

ZIP

发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal

2025年4月25日

发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal 数据来源：互联网公开数据标签：发票分析，商品分类，数据集，自然语言处理，机器学习，销售分析，商业智能，文本分类数据概述：该数据集包含来自商业交易发票的商品信息，记录了不同发票中商品的类别和相关信息。主要特征如下：...

ZIP

有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281

2025年4月25日

有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源：互联网公开数据标签：信息检索，波斯语，数据集，自然语言处理，机器学习，文本分类，多语言处理，语言技术数据概述：...

ZIP

文本领域分类数据集-gauravduttakiit

2025年4月25日

文本领域分类数据集-gauravduttakiit 数据来源：互联网公开数据标签：文本分类，自然语言处理，机器学习，数据集，领域识别，数据挖掘，文本分析，人工智能数据概述：该数据集包含用于文本领域分类的数据，记录了不同文本内容所属的领域信息。主要特征如下：时间跨度：数据记录的时间范围不限，涵盖了不同时期的文本数据。...

ZIP

文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava

2025年4月25日

文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava 数据来源：互联网公开数据标签：文档处理，数据集，文本分类，自然语言处理，机器学习，信息检索，文本分析，数据挖掘数据概述：该数据集包含经过过滤和分类的文档数据，记录了各类文档的文本内容和分类标签。主要特征如下：时间跨度：...

ZIP

二十新闻组文本分类数据集-thedevastator

2025年4月21日

二十新闻组文本分类数据集-thedevastator 数据来源：互联网公开数据标签：文本分类,新闻组,机器学习,数据集,自然语言处理,文本分析数据概述：本数据集包含约20,000篇新闻组文档，这些文档被分为20个不同的新闻组。数据集最初由Ken...

ZIP

垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg

2025年4月25日

垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg 数据来源：互联网公开数据标签：文本分类，垃圾短信，数据集，自然语言处理，机器学习，数据挖掘，通信安全，信息安全数据概述：...

ZIP

社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar

2025年4月25日

社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar 数据来源：互联网公开数据标签：仇恨言论，社交媒体，数据集，自然语言处理，机器学习，文本分类，情感分析，网络安全数据概述：该数据集包含来自社交媒体平台的数据，记录了用户发布的内容中是否包含仇恨言论的标注信息。主要特征如下：...

ZIP

电影评论情感分析数据集IMDBReviewsDataset-gulsendemir

2025年4月25日

电影评论情感分析数据集IMDBReviewsDataset-gulsendemir 数据来源：互联网公开数据标签：情感分析，电影评论，数据集，自然语言处理，机器学习，文本分类，数据挖掘，人工智能数据概述：该数据集包含来自IMDB（互联网电影数据库）的电影评论数据，记录了大量用户对电影的评价和情感倾向。主要特征如下：...

ZIP

乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab

2025年4月25日

乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源：互联网公开数据标签：语言处理，文本分析，自然语言处理，乌尔都语，机器学习，数据集，文本分类，多语言数据概述：该数据集包含来自互联网公开资源的乌尔都语文本数据，记录了乌尔都语的自然语言文本内容。主要特征如下：...

ZIP

自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound

2025年4月25日

自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源：互联网公开数据标签：自然语言处理，数据集，文本分析，机器学习，人工智能，语言模型，文本分类，情感分析数据概述：该数据集用于自然语言处理的入门学习和研究，记录了多种文本数据及相应的标注信息。主要特征如下：...

ZIP

找到3,936个数据集

注册成功！