-
情感分析预处理数据集POSNEGPreprocessedDataset-great23u5
情感分析预处理数据集POSNEGPreprocessedDataset-great23u5 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,预处理,文本挖掘,人工智能 数据概述:该数据集包含来自多个来源的文本数据,经过预处理后,专门用于情感分析任务。主要特征如下:... -
文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie
文本分析与自然语言处理数据集TextAnalysisandNLPDataset-jayjinnie 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,机器学习,情感分析,文本分类,语言模型,信息提取 数据概述: 该数据集包含来自多个来源的文本数据,记录了各类文本内容及其相关属性。主要特征如下:... -
俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell
俄罗斯新闻文本数据集Lenta-FontankaDataset-hosstell 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,俄语,数据集,文本分类,信息检索 数据概述: 该数据集包含了来自Lenta.ru和Fontanka.ru两个俄罗斯新闻网站的文本数据,记录了新闻文章的详细信息。主要特征如下:... -
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan
越南语情感分析测试集EvaluateVietnameseTestSetforSentimentAnalysis-phamngocquan 数据来源:互联网公开数据 标签:自然语言处理,情感分析,越南语,数据集,文本分类,机器学习,语言学,NLP 数据概述: 该数据集包含用于评估越南语情感分析模型的测试数据,记录了越南语文本的情感极性。主要特征如下:... -
文本毒性分类数据集-chenxidong
文本毒性分类数据集-chenxidong 数据来源:互联网公开数据 标签:文本分类,毒性检测,自然语言处理,机器学习,情感分析,文本分析,数据安全,社交媒体 数据概述: 该数据集包含了大量的文本数据,并标注了文本的毒性程度,旨在用于训练和评估文本毒性分类模型。主要特征如下: 时间跨度:... -
假新闻检测数据集BERTFakeNewsDetectionDataset-musawerhussain
假新闻检测数据集BERTFakeNewsDetectionDataset-musawerhussain 数据来源:互联网公开数据 标签:新闻分析,假新闻检测,数据集,文本分类,机器学习,自然语言处理,信息传播,数据挖掘 数据概述: 该数据集包含来自多个新闻来源的文本数据,专门用于假新闻检测任务。主要特征如下:... -
电影评论情感分析数据集MovieReviewSentimentAnalysis-rustamusmanov
电影评论情感分析数据集MovieReviewSentimentAnalysis-rustamusmanov 数据来源:互联网公开数据 标签:情感分析, 自然语言处理, 文本分类, 电影评论, 情感极性, 机器学习, 语料库, 情感标注 数据概述:... -
新闻文本分类数据集NewsTextClassification-zhangzheli
新闻文本分类数据集NewsTextClassification-zhangzheli 数据来源:互联网公开数据 标签:文本分类, 新闻, 标题, 正文, 机器学习, 自然语言处理, 多分类, 数据集 数据概述: 该数据集包含来自新闻网站的新闻文章,记录了文章的标题、正文以及所属类别信息,用于新闻文本的分类任务。主要特征如下:... -
商品描述文本分类数据集ProductDescriptionTextCategorizationDataset-its4iris
商品描述文本分类数据集ProductDescriptionTextCategorizationDataset-its4iris 数据来源:互联网公开数据 标签:商品描述, 文本分类, 产品信息, 文本挖掘, 机器学习, 数据集, 零售, 商品属性 数据概述:... -
世界银行项目文档主题分类数据集WorldBankProjectDocumentTopicClassification-tylersuard
世界银行项目文档主题分类数据集WorldBankProjectDocumentTopicClassification-tylersuard 数据来源:互联网公开数据 标签:文本分类, 世界银行, 项目文档, 多标签分类, 机器学习, 自然语言处理, 发展经济学, 政策分析 数据概述:... -
文本情感分析词向量数据集TextSentimentAnalysisWordEmbeddingDataset-sailhan
文本情感分析词向量数据集TextSentimentAnalysisWordEmbeddingDataset-sailhan 数据来源:互联网公开数据 标签:情感分析, 文本分类, 词向量, 自然语言处理, 机器学习, 深度学习, 语料库, 情感词典 数据概述:... -
自杀风险文本分类数据集SuicideRiskTextClassificationDataset-tonmoyabdullah
自杀风险文本分类数据集SuicideRiskTextClassificationDataset-tonmoyabdullah 数据来源:互联网公开数据 标签:心理健康,文本分类,数据集,自然语言处理,情感分析,机器学习,社会学研究,危机干预 数据概述:... -
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills
Jigsaw恶意评论检测数据集JigsawOffensiveObservationsDataset-gauravbrills 数据来源:互联网公开数据 标签:自然语言处理,文本分类,机器学习,情感分析,恶意评论,数据集,社交媒体,NLP 数据概述: 该数据集由 Jigsaw 团队提供,旨在用于检测在线评论中的恶意、侮辱性和攻击性言论。主要特征如下:... -
网络犯罪举报文本分类数据集CybercrimeReportingTextClassificationDataset-jastegsingh233
网络犯罪举报文本分类数据集CybercrimeReportingTextClassificationDataset-jastegsingh233 数据来源:互联网公开数据 标签:网络犯罪, 文本分类, 犯罪举报, 自然语言处理, 机器学习, 欺诈, 社交媒体, 安全 数据概述:... -
社交媒体情感分析文本数据集SocialMediaSentimentAnalysisTextDataset-royal10march
社交媒体情感分析文本数据集SocialMediaSentimentAnalysisTextDataset-royal10march 数据来源:互联网公开数据 标签:情感分析, 文本分类, 社交媒体, 情绪识别, 自然语言处理, 机器学习, 数据标注, 情感极性 数据概述:... -
中文预训练模型微调与对比学习数据集MinBERTContrastiveLossDataset-tangha2005
中文预训练模型微调与对比学习数据集MinBERTContrastiveLossDataset-tangha2005 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,对比学习,MinBERT,深度学习,文本分类,机器学习,数据增强 数据概述:... -
多模型科学问答预测数据集Multi-modelScienceQuestionAnsweringPredictionDataset-sorokin
多模型科学问答预测数据集Multi-modelScienceQuestionAnsweringPredictionDataset-sorokin 数据来源:互联网公开数据 标签:科学问答, 多模型融合, 预测分析, 机器学习, 自然语言处理, 文本分类, 模型集成, 知识推理 数据概述:... -
开放字幕有毒内容伪标签数据集OpenSubtitlesToxicPseudo-labelingDataset-shonenkov
开放字幕有毒内容伪标签数据集OpenSubtitlesToxicPseudo-labelingDataset-shonenkov 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,伪标签,机器学习,文本挖掘,数据增强 数据概述: 该数据集包含来自开放字幕项目(Open... -
求职简历文本分类数据集ResumeTextClassificationDataset-aaradhyasharmaa
求职简历文本分类数据集ResumeTextClassificationDataset-aaradhyasharmaa 数据来源:互联网公开数据 标签:简历分析, 文本分类, 自然语言处理, 职业分类, 机器学习, 数据标注, 简历解析, 职业发展 数据概述:... -
垃圾文本识别数据集RubbishTextDataset-sokoface
垃圾文本识别数据集RubbishTextDataset-sokoface 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,垃圾信息过滤,机器学习,文本分类,信息检索,数据挖掘 数据概述: 该数据集包含来自互联网的垃圾文本数据,记录了各种形式的垃圾信息,如广告、诈骗、低俗内容等。主要特征如下:...