-
Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificati...
Kaggle毒性评论分类数据集ToxicCommentClassificationChallenge训练集ToxicCommentClassificationChallengeTrainDataset-shahules 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,毒性检测,评论分析,社交媒体,深度学习,NLP 数据概述:... -
大规模恶意评论检测数据集ToxicCommentClassificationChallenge-amankumar2002
大规模恶意评论检测数据集ToxicCommentClassificationChallenge-amankumar2002 数据来源:互联网公开数据 标签:文本分类,自然语言处理,深度学习,恶意评论,情感分析,数据集,机器学习,NLP 数据概述:... -
语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001
语料库2023自然语言处理推理数据集Corpus2023NaturalLanguageProcessingInferenceDataset-dungdo1001 数据来源:互联网公开数据 标签:自然语言处理,NLP,推理,数据集,机器学习,文本分析,语言模型,人工智能 数据概述:... -
新闻文本情感分析数据集NewsTextSentimentAnalysisDataset-jehzi123
新闻文本情感分析数据集NewsTextSentimentAnalysisDataset-jehzi123 数据来源:互联网公开数据 标签:新闻文本,情感分析,自然语言处理,数据集,机器学习,文本分类,舆情分析,NLP 数据概述: 该数据集包含了大量的新闻文本及其对应的情感标签,用于情感分析、文本分类等任务。主要特征如下:... -
土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat
土耳其大国民议会命名实体识别数据集TBMMNERDataset-esrapolat 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,土耳其语,数据集,文本分析,政治,机器学习,NLP 数据概述: 该数据集包含来自土耳其大国民议会(TBMM)的文本数据,用于命名实体识别(NER)任务。主要特征如下:... -
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview
NIT项目-自然语言处理数据集NITProject-NaturalLanguageProcessingDataset-peculiarview 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器翻译,情感分析,信息抽取,文本分类 数据概述: 该数据集由NIT项目提供,包含了多种自然语言处理任务的文本数据。主要特征如下:... -
越南语句情感分析数据集-taitruong256
越南语句情感分析数据集-taitruong256 数据来源:互联网公开数据 标签:越南语,情感分析,NLP,数据集,文本处理,机器学习,自然语言处理,语言学 数据概述: 该数据集包含来自越南语的句子及其对应的情感标签,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,但包含多个不同时期的越南语文本。... -
恶意信息文本分类数据集-aniketgupta01
恶意信息文本分类数据集-aniketgupta01 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,恶意信息,情感分析,数据集,NLP,深度学习 数据概述: 该数据集包含用于恶意信息文本分类的文本数据,旨在识别和区分文本中的恶意内容。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含了当前常见的网络用语和恶意表达方式。... -
Transformer模型研究与应用数据集TransformersDataset-a24998667
Transformer模型研究与应用数据集TransformersDataset-a24998667 数据来源:互联网公开数据 标签:自然语言处理,深度学习,Transformer,数据集,机器翻译,文本生成,NLP,模型训练 数据概述: 该数据集包含了用于训练和评估Transformer模型的数据,主要涵盖了各种自然语言处理任务。主要特征如下:... -
特朗普政治言论分析用推特数据集
数据简介: 该数据集收集了与唐纳德·特朗普(Donald Trump)相关的推文文本及其元信息,内容涵盖用户生成的转发、评论和直接提及。数据时间上集中于2015年前后美国大选时期,具有一定的舆情代表性,可用于情感分析、文本分类、信息传播研究、政治观点分析等多种任务。 数据源自 Twitter... -
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-sushii2512
越南语命名实体识别数据集VietnameseNamedEntityRecognitionDataset-sushii2512 数据来源:互联网公开数据 标签:自然语言处理, 命名实体识别, 越南语, 文本标注, 序列标注, 语言学, 机器学习, NLP 数据概述: 该数据集包含来自越南语文本的标注数据,用于训练和评估命名实体识别模型。主要特征如下:... -
互联网电影评论情感分析数据集ACL-IMDBConcatenatedDataset-gaussmake1994
互联网电影评论情感分析数据集ACL-IMDBConcatenatedDataset-gaussmake1994 数据来源:互联网公开数据 标签:情感分析,自然语言处理,文本分类,机器学习,电影评论,NLP,情感极性,数据集 数据概述: 该数据集由ACL(Association for Computational... -
越南语10万句数据集-duongtrunghien
越南语10万句数据集-duongtrunghien 数据来源:互联网公开数据 标签:越南语,数据集,自然语言处理,文本分析,机器翻译,语言学,文本语料库,NLP 数据概述: 该数据集包含约10万句越南语文本,涵盖了多种主题和语体。主要特征如下: 时间跨度:数据无明确的时间范围,主要反映现代越南语的使用情况。... -
情感分析数据集SentimentAnalysisDataset-wyldream
情感分析数据集SentimentAnalysisDataset-wyldream 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,数据集,机器学习,情感分类,情绪识别,NLP 数据概述: 该数据集包含了用于情感分析任务的文本数据,主要用于识别文本所表达的情感倾向。主要特征如下:... -
葡萄牙语新闻摘要数据集PortugueseNewsSummaryDataset-raquelclementesilva
葡萄牙语新闻摘要数据集PortugueseNewsSummaryDataset-raquelclementesilva 数据来源:互联网公开数据 标签:自然语言处理,文本摘要,葡萄牙语,数据集,深度学习,NLP,新闻,机器翻译 数据概述: 该数据集包含葡萄牙语新闻文章及其对应的摘要,旨在用于文本摘要任务。主要特征如下:... -
纽约时报文章标题与摘要数据集2010-2021-tmishinev
纽约时报文章标题与摘要数据集2010-2021-tmishinev 数据来源:互联网公开数据 标签:纽约时报,NLP,情感分析,新闻标题,摘要,文本数据,时间序列,新闻媒体 数据概述:... -
亚马逊产品评论情感分析训练数据集-2021-humagonen
亚马逊产品评论情感分析训练数据集-2021-humagonen 数据来源:互联网公开数据 标签:亚马逊评论,情感分析,NLP,文本数据,产品评价,训练数据,清洗数据 数据概述:... -
俄罗斯YouTube频道-вдудь-视频评论文本数据集-2020年
俄罗斯YouTube频道-вдудь-视频评论文本数据集-2020年 数据来源:互联网公开数据 标签:YouTube,评论,俄罗斯,语言,文本分析,NLP,视频,社交媒体,情感分析 数据概述:... -
德语新闻文章主题提取数据集-2011-whenamancodes
德语新闻文章主题提取数据集-2011-whenamancodes 数据来源:互联网公开数据 标签:NLP,德语,新闻文章,主题分类,数据集,学术研究,机器学习,新闻学 数据概述:... -
英国网上书店书籍元数据数据集-2023
英国网上书店书籍元数据数据集-2023 数据来源:互联网公开数据 标签:书籍元数据,网络爬虫,图书信息,分类,描述,图像,ISBN,评分,计算机视觉,NLP 数据概述: 本数据集包含从bookdepository.com网站爬取的大量书籍元数据,涵盖书籍的标题、描述、尺寸、类别、封面图像等关键信息。数据集中的每个样本包含以下字段: authors:...