-
自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater
自然语言处理项目复现数据集NLPProjectRecreationDataset-shankanater 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,机器翻译,项目复现 数据概述: 该数据集旨在为自然语言处理(NLP)项目复现提供数据支持,包含多种文本类型和任务的数据集。主要特征如下: 时间跨度:... -
文本评论有毒性检测数据集TextCommentToxicityDetection-weihengluo
文本评论有毒性检测数据集TextCommentToxicityDetection-weihengluo 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 情感分析, 机器学习, 自然语言处理, 深度学习, 数据标注 数据概述: 该数据集包含来自在线评论平台的数据,记录了用户发布的评论文本及其对应的毒性标签。主要特征如下:... -
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost
预处理新闻数据集Roberta版本新闻数据集Pre-ProcessedNewsDatasetsforRoberta-crypticghost 数据来源:互联网公开数据 标签:新闻数据集,预处理,自然语言处理,机器学习,文本分析,Roberta模型,文本分类,情感分析 数据概述:... -
中文文本情感分析数据集ChineseTextSentimentAnalysis-anasmashadchowdhury
中文文本情感分析数据集ChineseTextSentimentAnalysis-anasmashadchowdhury 数据来源:互联网公开数据 标签:情感分析, 文本分类, 中文文本, 情感极性, 自然语言处理, 机器学习, 情感标注, 数据集 数据概述: 该数据集包含来自互联网的中文文本数据,记录了文本内容及其对应的情感极性。主要特征如下:... -
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers
法律文档检索数据集BKALegalDocumentRetrievalCorpus-ictunivers 数据来源:互联网公开数据 标签:法律,文档检索,数据集,信息检索,自然语言处理,文本分类,法律科技,机器学习 数据概述: 该数据集包含来自德国联邦刑事警察局(BKA)的法律文档检索数据,记录了法律文档的检索和分类信息。主要特征如下:... -
社交平台评论毒性评估数据集SocialPlatformCommentToxicityAssessment-simonmeoni
社交平台评论毒性评估数据集SocialPlatformCommentToxicityAssessment-simonmeoni 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 评论分析, 自然语言处理, 机器学习, 情感分析, 社交媒体, 语料库 数据概述:... -
学生写作质量评估数据集StudentEssayQualityAssessment-jay12332
学生写作质量评估数据集StudentEssayQualityAssessment-jay12332 数据来源:互联网公开数据 标签:文本分析, 写作评估, 机器学习, 自然语言处理, 情感分析, 文本分类, 教育, 语料库 数据概述: 该数据集包含来自不同来源的学生写作文章,旨在用于评估学生的写作质量。主要特征如下:... -
社交媒体平台仇恨言论与攻击性内容分析数据集SocialMediaHateSpeechandOffensiveContentAnalysis-jujoooo
社交媒体平台仇恨言论与攻击性内容分析数据集SocialMediaHateSpeechandOffensiveContentAnalysis-jujoooo 数据来源:互联网公开数据 标签:仇恨言论, 攻击性内容, 文本分析, 情感分析, 社交媒体, 文本分类, 自然语言处理, 数据标注 数据概述:... -
商品标题分类数据集ProductTitleCategorizationDataset-nelsonjavier
商品标题分类数据集ProductTitleCategorizationDataset-nelsonjavier 数据来源:互联网公开数据 标签:商品分类, 文本分类, 标题分析, 零售, 类别预测, 数据标注, 机器学习, 商品推荐 数据概述: 该数据集包含来自电商平台或商品目录的商品标题数据,记录了商品标题文本与其对应的商品类别。主要特征如下:... -
虚假新闻综合数据集CombinedFakeNewsDataset-saidurabir
虚假新闻综合数据集CombinedFakeNewsDataset-saidurabir 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,文本分类,自然语言处理,机器学习,舆情分析,社交媒体,信息真伪 数据概述: 该数据集整合了多个来源的虚假新闻数据,旨在为研究人员提供一个全面的、用于虚假新闻检测和分析的资源。主要特征如下:... -
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu
多语言歌词数据集-音乐风格分类MultilingualLyricsforGenreClassificationDataset-anhclu 数据来源:互联网公开数据 标签:音乐风格,歌词分析,数据集,机器学习,文本分类,多语言,自然语言处理,数据挖掘 数据概述: 该数据集包含来自多种语言的歌曲歌词,主要用于音乐风格分类任务。主要特征如下:... -
通用语料库数据集CorpusDataset-cthitrn
通用语料库数据集CorpusDataset-cthitrn 数据来源:互联网公开数据 标签:语料库,自然语言处理,数据集,文本分析,机器学习,数据挖掘,语言模型,文本分类 数据概述: 该数据集包含来自多种来源的文本数据,记录了不同领域的语言表达。主要特征如下: 时间跨度:数据记录的时间范围从20世纪到现代。... -
用户产品评论情感分析数据集UserProductReviewSentimentAnalysisDataset-hoangducchung
用户产品评论情感分析数据集UserProductReviewSentimentAnalysisDataset-hoangducchung 数据来源:互联网公开数据 标签:情感分析, 产品评论, 文本分类, 情感极性, 机器学习, 自然语言处理, 用户反馈, 数据集 数据概述:... -
改良版虚假新闻评论识别数据集ModifiedFNC-1FakeNewsCommentIdentificationDataset-yovita
改良版虚假新闻评论识别数据集ModifiedFNC-1FakeNewsCommentIdentificationDataset-yovita 数据来源:互联网公开数据 标签:虚假新闻,新闻评论,数据集,自然语言处理,机器学习,文本分类,信息传播,新闻媒体 数据概述: 该数据集为改良版虚假新闻评论识别数据集(Modified... -
Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificati...
Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificationChallengeTrainDataset-shahules 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,毒性检测,评论分析,社交媒体,深度学习,NLP 数据概述:... -
代码安全检测恶意代码数据集CodeSecurityDetectionMaliciousCodeDataset-pritioli
代码安全检测恶意代码数据集CodeSecurityDetectionMaliciousCodeDataset-pritioli 数据来源:互联网公开数据 标签:代码安全, 恶意代码, 文本分类, 机器学习, 源代码分析, 代码检测, 垃圾邮件, 安全防护 数据概述: 该数据集包含从公开渠道收集的源代码片段,用于识别潜在的恶意代码。主要特征如下:... -
短视频文本内容分类数据集ShortVideoTextContentClassificationDataset-yumoan
短视频文本内容分类数据集ShortVideoTextContentClassificationDataset-yumoan 数据来源:互联网公开数据 标签:短视频, 文本分类, 内容分析, 视频标题, 机器学习, 情感分析, 视频理解, 数据清洗 数据概述:... -
新闻文本分类数据集NewsTextClassification-shwe1308
新闻文本分类数据集NewsTextClassification-shwe1308 数据来源:互联网公开数据 标签:新闻文本, 文本分类, 政治, 经济, 机器学习, 自然语言处理, 数据标注, 舆情分析 数据概述: 该数据集包含来自新闻报道的文本数据,记录了新闻标题、正文内容、主题、发布日期和标签信息。主要特征如下:... -
医学文献摘要文本分类数据集MedicalLiteratureAbstractTextClassification-bersaliasma
医学文献摘要文本分类数据集MedicalLiteratureAbstractTextClassification-bersaliasma 数据来源:互联网公开数据 标签:医学, 文本分类, 摘要, 疾病研究, 生物医学, 机器学习, 自然语言处理, 肿瘤学 数据概述:... -
情感分析模型训练与评估数据集SentimentAnalysisModelTrainingandEvaluationDataset-mafazachabane
情感分析模型训练与评估数据集SentimentAnalysisModelTrainingandEvaluationDataset-mafazachabane 数据来源:互联网公开数据 标签:情感分析, 文本分类, 深度学习, 情感标签, 模型训练, 词嵌入, 自然语言处理, 数据集 数据概述:...