-
垃圾邮件分类文本数据集SpamClassificationTextDataset-asselkabdenova
垃圾邮件分类文本数据集SpamClassificationTextDataset-asselkabdenova 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 机器学习, 邮件过滤, 文本预处理, 二元分类, 数据挖掘 数据概述: 该数据集包含来自邮件系统的数据,记录了用于垃圾邮件识别的电子邮件文本内容。主要特征如下:... -
文本情感分析与特征工程数据集TextSentimentAnalysisandFeatureEngineering-akscent
文本情感分析与特征工程数据集TextSentimentAnalysisandFeatureEngineering-akscent 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 特征工程, 自然语言处理, 机器学习, 文本预处理, 情感极性, 评价星级 数据概述:... -
文本情感分析训练数据集TextSentimentAnalysisTrainingData-manojahi
文本情感分析训练数据集TextSentimentAnalysisTrainingData-manojahi 数据来源:互联网公开数据 标签:文本情感分析, 情感分类, 自然语言处理, 机器学习, 情感词典, 文本预处理, 数据集, 深度学习 数据概述: 该数据集包含用于文本情感分析任务的数据,包括训练集、测试集以及预训练的词向量。主要特征如下:... -
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov
俄语推特情感分析数据集RussianTweetsSentimentAnalysisDataset-denislysov 数据来源:互联网公开数据 标签:情感分析, 俄语, 文本处理, 自然语言处理, 机器学习, 文本预处理, 词干提取, 二分类 数据概述: 该数据集包含来自推特的俄语文本数据,用于情感分析研究。主要特征如下:... -
代码单元格预处理文本分析数据集CodeCellPreprocessedTextAnalysisDataset-bantencrues
代码单元格预处理文本分析数据集CodeCellPreprocessedTextAnalysisDataset-bantencrues 数据来源:互联网公开数据 标签:代码分析, 文本预处理, 自然语言处理, 代码理解, 机器学习, 数据挖掘, Jupyter Notebook, 代码片段 数据概述: 该数据集包含来自Jupyter... -
心理健康状态文本分析数据集MentalHealthStatusTextAnalysisDataset-duylngvn
心理健康状态文本分析数据集MentalHealthStatusTextAnalysisDataset-duylngvn 数据来源:互联网公开数据 标签:心理健康, 文本分析, 情感分析, 焦虑, 自然语言处理, 状态分类, 机器学习, 文本预处理 数据概述:... -
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen
问题相似度判断预处理数据集QuestionSimilarityPreprocessedDataset-longhainguyen 数据来源:互联网公开数据 标签:问题相似度, 文本预处理, 自然语言处理, 问答系统, 文本分类, 语义分析, 数据清洗, 机器学习 数据概述:... -
文本情感分析训练测试数据集TextSentimentAnalysisTrainingandTestingDataset-nuhashafnan
文本情感分析训练测试数据集TextSentimentAnalysisTrainingandTestingDataset-nuhashafnan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 机器学习, 自然语言处理, 情感极性, 数据集, 文本预处理, 词干提取 数据概述:... -
邮件垃圾信息分类数据集EmailSpamDetectionDataset-yelbouknify
邮件垃圾信息分类数据集EmailSpamDetectionDataset-yelbouknify 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 邮件分析, 二分类, 机器学习, 数据标注, 文本预处理 数据概述:... -
阿拉伯语词频统计数据集ArabicWordFrequencyStatistics-mohamedahmed21
阿拉伯语词频统计数据集ArabicWordFrequencyStatistics-mohamedahmed21 数据来源:互联网公开数据 标签:阿拉伯语, 词频统计, 自然语言处理, 文本分析, 语言学, 数据挖掘, 情感分析, 文本预处理 数据概述: 该数据集包含来自阿拉伯语文本的数据,记录了阿拉伯语单词及其出现频率。主要特征如下:... -
俄语文本情感分析训练数据集RussianTextSentimentAnalysisTrainingDataset-nemytovsimon
俄语文本情感分析训练数据集RussianTextSentimentAnalysisTrainingDataset-nemytovsimon 数据来源:互联网公开数据 标签:情感分析, 文本分类, 俄语, 自然语言处理, 机器学习, 情感标注, 文本预处理, 情感极性 数据概述: 该数据集包含俄语文本,记录了用于情感分析任务的文本样本。主要特征如下:... -
社交媒体情绪分析抑郁症相关推文数据集SocialMediaSentimentAnalysisDatasetforDepression-relatedTwe...
社交媒体情绪分析抑郁症相关推文数据集SocialMediaSentimentAnalysisDatasetforDepression-relatedTweets-anuragggggg23 数据来源:互联网公开数据 标签:情感分析, 抑郁症, 社交媒体, 文本挖掘, 自然语言处理, VADER, 情绪识别, 文本预处理 数据概述:... -
维基新闻文本分类数据集WikinewsTextClassificationDataset-nekuitiefangbiediant
维基新闻文本分类数据集WikinewsTextClassificationDataset-nekuitiefangbiediant 数据来源:互联网公开数据 标签:文本分类, 新闻语料, 法语, 维基新闻, 自然语言处理, 文本预处理, 数据标注, 多类别分类 数据概述:... -
社交媒体文本情感分析数据集SocialMediaTextSentimentAnalysis-iversencpatrick
社交媒体文本情感分析数据集SocialMediaTextSentimentAnalysis-iversencpatrick 数据来源:互联网公开数据 标签:情感分析, 文本挖掘, 自然语言处理, 机器学习, 文本预处理, 情感分类, 数据集, 社交媒体 数据概述:... -
垃圾邮件分类文本数据集SpamEmailClassificationTextDataset-mukulnagar
垃圾邮件分类文本数据集SpamEmailClassificationTextDataset-mukulnagar 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 邮件数据, 情感分析, 数据标注, 机器学习, 文本预处理 数据概述: 该数据集包含来自电子邮件的数据,记录了用于垃圾邮件检测的文本信息。主要特征如下:... -
孟加拉语文本规范化数据集NormalizedPre-BengaliAIDataset-vaibhavsharma3012
孟加拉语文本规范化数据集NormalizedPre-BengaliAIDataset-vaibhavsharma3012 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本规范化,数据集,语言模型,文本预处理,机器学习,人工智能 数据概述: 该数据集包含经过规范化处理的孟加拉语文本数据,旨在用于孟加拉语自然语言处理任务。主要特征如下:... -
情感分析文本数据集SentimentAnalysisTextDataset-dtughdr
情感分析文本数据集SentimentAnalysisTextDataset-dtughdr 数据来源:互联网公开数据 标签:情感分析, 文本分类, 情绪识别, 自然语言处理, 情感词典, 机器学习, 文本预处理, 情绪表达 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了不同文本内容所表达的情感。主要特征如下:... -
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal
孟加拉语文本翻译数据集BengaliTextTranslationDataset-vihaanagrawal 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 孟加拉语, 语言学, 自然语言处理, 语料库, 文本预处理, 语言模型 数据概述: 该数据集包含来自互联网的孟加拉语文本片段,记录了用于机器翻译训练的孟加拉语文本。主要特征如下:... -
恩隆公司邮件内容词频统计数据集EnronEmailContentWordFrequencyStatistics-sakshamkmar
恩隆公司邮件内容词频统计数据集EnronEmailContentWordFrequencyStatistics-sakshamkmar 数据来源:互联网公开数据 标签:邮件分析, 文本挖掘, 词频统计, 自然语言处理, 商业分析, Enron, 数据集, 文本预处理 数据概述:... -
垃圾邮件文本分类数据集SpamEmailTextClassificationDataset-nimitabithi
垃圾邮件文本分类数据集SpamEmailTextClassificationDataset-nimitabithi 数据来源:互联网公开数据 标签:垃圾邮件, 文本分类, 自然语言处理, 邮件过滤, 机器学习, 二元分类, 文本预处理, 数据标注 数据概述: 该数据集包含来自电子邮件的数据,记录了用于识别垃圾邮件的文本内容。主要特征如下:...