-
议论文分析与文本分类论点要素标注数据集
议论文分析与文本分类论点要素标注数据集 数据来源:互联网公开数据 标签:议论文,文本分类,论点分析,论点要素,有效性评估,自然语言处理 数据概述:... -
宝莱坞视频点击诱饵分类与特征分析数据集
宝莱坞视频点击诱饵分类与特征分析数据集 数据来源:互联网公开数据 标签:宝莱坞,点击诱饵,视频分析,电影,娱乐,文本分类,机器学习,数据挖掘 数据概述:... -
情感分类不平衡数据集
情感分类不平衡数据集 数据来源:互联网公开数据 标签:情感分析,不平衡分类,半监督学习,文本分类,自然语言处理,机器学习 数据概述: 本数据集为解决情感分析中的类别不平衡问题而构建,涵盖三种情感类别:Negative、Positive和Neutral。初始阶段收集了620条评论数据,各类别分布分别为Negative 150条、Positive... -
NLP机器人用户提问意图分类数据集
NLP机器人用户提问意图分类数据集 数据来源:互联网公开数据 标签:自然语言处理,NLP,用户提问,意图识别,文本分类,机器学习,人工智能,prompt,用户交互 数据概述: 本数据集旨在对NLP机器人接收到的用户提问进行分类。数据集的核心是用户输入的文本内容(即用户提问),并为每个提问标注了相应的类别标签,以反映用户提问的意图。... -
-
-
印度大选期间BJP与国大党推特数据集2023
印度大选期间BJP与国大党推特数据集2023 数据来源:互联网公开数据 标签:印度选举,推特数据,政治分析,情感分析,文本分类,话题建模,BJP,国大党 数据概述: 本数据集收录了2023年印度大选期间与印度两大主要政党——BJP和国大党相关联的推特内容。数据集通过Twitter... -
数据200-20新闻组文本分类数据集
数据200-20新闻组文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,新闻组,文本预处理,机器学习,监督学习 数据概述: 本数据集是一个经过预处理的文本数据集合,来源为scikit-learn提供的20... -
大型加密货币交易所黑客攻击相关推文数据集
大型加密货币交易所黑客攻击相关推文数据集 数据来源:互联网公开数据 标签:加密货币,黑客攻击,社交媒体分析,文本分类,投资者行为,市场预测 数据概述: 本数据集包含2020年9月期间关于一家知名加密货币交易所遭受黑客攻击事件的相关推文。这些推文记录了事件发生后社交媒体上公众的即时反应和讨论,为分析加密货币市场的动态变化提供了丰富的文本数据资源。... -
马拉维新闻分类挑战数据集
马拉维新闻分类挑战数据集 数据来源:互联网公开数据 标签:马拉维,新闻分类,机器学习,数据挑战,自然语言处理,文本分类,社会发展,政治经济,文化环境 数据概述: 本数据集来源于马拉维的主要新闻出版物,由tnyasa Ltd Data Science Lab 收集并整理,涵盖Nation Online报纸、Radio... -
印度短信垃圾信息与正常信息分类数据集
印度短信垃圾信息与正常信息分类数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,文本分类,自然语言处理,数据分析,机器学习,信息过滤 数据概述:... -
罗伊诉韦德案取消后推特立场观点数据集1963-2021
罗伊诉韦德案取消后推特立场观点数据集1963-2021 数据来源:互联网公开数据 标签:推特数据,罗伊诉韦德案,立场观点,社会议题,情感分析,文本分类,公共讨论 数据概述:... -
马拉维公共卫生疾病监测与应对问答数据集2020
马拉维公共卫生疾病监测与应对问答数据集2020 数据来源:互联网公开数据 标签:马拉维,公共卫生,疾病监测,问答数据,文本分类,机器学习,信息检索,培训材料 数据概述:... -
亚马逊商品评论与评分预测数据集
亚马逊商品评论与评分预测数据集 数据来源:互联网公开数据 标签:亚马逊,评论分析,情感分析,评分预测,文本分类,电子商务,机器学习 数据概述 本数据集来源于亚马逊网站,通过爬取亚马逊商品的用户评论及其对应的评分构建而成。数据集包含约50,000条商品评论及其对应的5分制评分。每条记录主要包含以下两个关键字段: 1.... -
COVID-19疫苗相关文章数据集
COVID-19疫苗相关文章数据集 数据来源:互联网公开数据 标签:COVID-19,疫苗,新闻文章,正反观点,人工智能,文本分类 数据概述: 本数据集包含一系列与COVID-19疫苗相关的文章,内容涉及公众对疫苗的不同观点。数据集中的文章被分为两大类:支持疫苗(Pro-vaccine)和反对疫苗(Anti-... -
综合新闻文章数据集
综合新闻文章数据集 数据来源:互联网公开数据 标签:新闻文章,自然语言处理,情感分析,主题建模,机器学习,文本分类,命名实体识别 数据概述: 本数据集汇集了来自多个来源的新闻文章,涵盖了包括科技、体育、金融、政治、教育、健康和娱乐在内的多个类别。数据集旨在为自然语言处理(NLP)任务、情感分析、主题建模等机器学习应用提供多样且广泛的数据支持。... -
IMDB电影评论情感分析数据集-1万条评论-二元分类
IMDB电影评论情感分析数据集-1万条评论-二元分类 数据来源:互联网公开数据 标签:IMDB,电影评论,情感分析,文本分类,二元分类,自然语言处理,机器学习,情感极性 数据概述:... -
尼泊尔新闻文本分类数据集-多领域-2024
尼泊尔新闻文本分类数据集-多领域-2024 数据来源:互联网公开数据 标签:尼泊尔,新闻,文本分类,政治,社会,体育,博客,国际,舆情分析,NLP 数据概述:... -
-
BBC新闻数据集-2226
BBC新闻数据集-2226 数据来源:互联网公开数据 标签:BBC新闻,自然语言处理,NLP,文本分类,新闻标签,2004-2005,商业,娱乐,政治,体育,科技 数据概述:...