-
垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems
垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems 数据来源:互联网公开数据 标签:垃圾邮件,数据集,机器学习,文本分类,自然语言处理,电子邮件,数据分析,信息安全 数据概述: 该数据集包含用于垃圾邮件检测的训练数据,记录了电子邮件的分类标签和内容信息。主要特征如下:... -
自然语言处理项目数据集NLPProjectDataset-nikunjphutela
自然语言处理项目数据集NLPProjectDataset-nikunjphutela 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,语言模型,数据集,文本分类,情感分析 数据概述: 该数据集为自然语言处理项目专用,记录了多种文本数据及相关标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
阿拉伯语文本情感分析数据集-akshat18
阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:... -
超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan
超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,机器学习,深度学习,文本分类,语言模型,人工智能,数据集 数据概述: 该数据集包含来自超大规模预训练语言模型 HS-XLNet 的数据,记录了大规模文本语料的预训练过程和结果。主要特征如下:... -
情感分析数据集SentimentAnalysisDataset-jauharazka
情感分析数据集SentimentAnalysisDataset-jauharazka 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本分类,机器学习,情感挖掘,数据挖掘,人工智能 数据概述: 该数据集包含来自公开来源的文本数据,记录了不同场景下的文本及其对应的情感标签。主要特征如下:... -
性别识别数据集GenderIdentificationDataset-srimadhumithak
性别识别数据集GenderIdentificationDataset-srimadhumithak 数据来源:互联网公开数据 标签:性别识别,数据集,机器学习,自然语言处理,社会研究,数据分析,人工智能,文本分类 数据概述: 该数据集包含来自互联网的公开数据,记录了用于性别识别的文本数据。主要特征如下:... -
阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi
阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,数据集,自然语言处理,文本分类,机器学习,语言处理,情感计算 数据概述: 该数据集包含来自阿拉伯语社交媒体平台和评论网站的情感分析数据,记录了用户对特定主题或产品的情感表达。主要特征如下:... -
简历文本分类数据集ResumeTextClassificationDataset-blackitten13
简历文本分类数据集ResumeTextClassificationDataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,简历分析,机器学习,招聘,人力资源,职业发展 数据概述:该数据集包含来自公开的简历文本数据,记录了不同行业和职位的个人简历信息。主要特征如下:... -
越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph
越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph 数据来源:互联网公开数据 标签:自然语言处理,文本分类,多标签分类,越南语,作文分析,机器学习,教育技术,语言研究 数据概述:... -
推文分类训练数据集TweetClassificationTrainingDataset-abhishek
推文分类训练数据集TweetClassificationTrainingDataset-abhishek 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,机器学习,自然语言处理,情感分析,情感识别,数据挖掘 数据概述:该数据集包含来自社交媒体平台(如Twitter)的推文数据,记录了用户发布的文本内容及其分类标签。主要特征如下:... -
推特文本情感分析训练与提交数据集-anandvatkar
推特文本情感分析训练与提交数据集-anandvatkar 数据来源:互联网公开数据 标签:推特数据,情感分析,机器学习,自然语言处理,文本分类,社交媒体,数据集,人工智能 数据概述: 该数据集包含了推特(Twitter)上的文本数据,用于情感分析模型的训练和提交。主要特征如下: 时间跨度:数据记录的时间跨度未知,取决于推特数据的收集时间。... -
路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9
路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9 数据来源:互联网公开数据 标签:新闻文本,文本分类,机器学习,自然语言处理,数据集,信息检索,语料库,路透社 数据概述: 该数据集包含来自路透社的新闻文章,主要用于文本分类任务。主要特征如下:... -
医学文献自然语言处理数据集PreprocessedPubMed200kRCTDataset-aliakseibrown
医学文献自然语言处理数据集PreprocessedPubMed200kRCTDataset-aliakseibrown 数据来源:互联网公开数据 标签:医学文献,自然语言处理,数据集,文本分析,机器学习,医学研究,文本分类,学术资源... -
密歇根大学自然语言处理数据集UMICHSI650NLPDataset-seesea0203
密歇根大学自然语言处理数据集UMICHSI650NLPDataset-seesea0203 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,语义分析,情感识别,语言技术 数据概述: 该数据集由密歇根大学SI650课程提供,主要记录了文本数据的情感倾向分类,适用于自然语言处理和情感分析任务。主要特征如下:... -
真实与虚假灾害推文数据集RealandFakeDisasterTweetsDataset-aman2000jaiswal
真实与虚假灾害推文数据集RealandFakeDisasterTweetsDataset-aman2000jaiswal 数据来源:互联网公开数据 标签:自然语言处理,灾害分析,数据集,文本分类,机器学习,社交媒体,情感分析,虚假信息 数据概述:该数据集包含来自社交媒体平台推文的文本数据,记录了真实与虚假灾害相关的推文内容。主要特征如下:... -
宠物主人情绪识别数据集PAWSTest2Dataset-ibrahim2002
宠物主人情绪识别数据集PAWSTest2Dataset-ibrahim2002 数据来源:互联网公开数据 标签:情感分析,宠物,数据集,自然语言处理,机器学习,文本分类,人机交互,社交媒体 数据概述: 该数据集包含来自社交媒体平台的数据,记录了宠物主人的文本内容,用于分析宠物主人对宠物的情感表达。主要特征如下:... -
客户服务意图识别数据集CustomerServiceIntentClassificationDataset-arunmohan003
客户服务意图识别数据集CustomerServiceIntentClassificationDataset-arunmohan003 数据来源:互联网公开数据 标签:客户服务,意图识别,数据集,自然语言处理,文本分类,机器学习,人工智能,情感分析 数据概述:... -
有毒评论特征数据集ToxicFeaturesDataset-maksiamiogan
有毒评论特征数据集ToxicFeaturesDataset-maksiamiogan 数据来源:互联网公开数据 标签:评论分析,数据集,自然语言处理,机器学习,文本分类,社交媒体,数据分析,人工智能 数据概述: 该数据集包含来自社交媒体平台的评论数据,记录了用户评论的文本内容以及相关特征,特别是与有毒评论相关的特征。主要特征如下:... -
孟加拉语垃圾邮件数据集BanglaSpamEmailDataset-durjoymistry
孟加拉语垃圾邮件数据集BanglaSpamEmailDataset-durjoymistry 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,孟加拉语,数据集,机器学习,邮件过滤,情感分析 数据概述: 该数据集包含了孟加拉语的电子邮件数据,用于垃圾邮件检测和文本分类任务。主要特征如下: 时间跨度:... -
印地语仇恨言论检测数据集-blurred8216
印地语仇恨言论检测数据集-blurred8216 数据来源:互联网公开数据 标签:仇恨言论,印地语,自然语言处理,文本分类,机器学习,情感分析,社交媒体,语言学 数据概述:该数据集包含来自各种来源的印地语文本数据,主要用于仇恨言论的检测和分类。主要特征如下: 时间跨度:数据收集的时间范围不详,但涵盖了近期社交媒体和互联网上的文本。...