-
-
-
全球议题新闻分类数据集
全球议题新闻分类数据集 数据来源:互联网公开数据 标签:新闻分类,全球议题,文本分类,多分类问题,不平衡数据,动态更新,机器学习基准数据集 数据概述... -
-
-
网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用
网络安全BERT模型训练数据集-网络安全文本数据-多源文本-通用 数据来源:互联网公开数据 标签:网络安全,BERT,NLP,威胁检测,文本分类,恶意软件分析,漏洞,网络安全威胁,文本数据,机器学习 数据概述: Cyber-... -
全球金融新闻与股市关联性研究数据集2007-2023
全球金融新闻与股市关联性研究数据集2007-2023 数据来源:互联网公开数据 标签:金融新闻,股市预测,情感分析,因果关系,文本分类,LSTM,金融市场研究 数据概述:... -
印度政治推文数据集
印度政治推文数据集 数据来源:互联网公开数据 标签:印度政治,推文数据,情感分析,选举活动,文本分类,党派分析,社交媒体舆情 数据概述 本数据集包含与印度主要政党之一——印度人民党(Bharatiya Janata Party, BJP)相关的推文记录,涵盖了其在选举活动期间的公众舆论动态。数据集中的推文通过Twitter... -
-
-
印度网络言论仇恨言论分类数据集2023
印度网络言论仇恨言论分类数据集2023 数据来源:互联网公开数据 标签:仇恨言论,网络言论,文本分类,机器学习,算法模型,社交媒体分析,内容审查 数据概述:... -
新闻组文章分类数据集1990-2000
新闻组文章分类数据集1990-2000 数据来源:互联网公开数据 标签:新闻组,文本分类,文本预处理,文本聚类,主题挖掘,主题分类,自然语言处理 数据概述:... -
-
-
印度泰米尔-英语文本情感分析数据集2021
印度泰米尔-英语文本情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,泰米尔语,英语,多语言处理,社交媒体评论,文本分类,自然语言处理 数据概述: 本数据集包含从YouTube视频评论中收集的15,744条泰米尔-... -
灾害推文分类训练数据集
灾害推文分类训练数据集 数据来源:互联网公开数据 标签:灾害推文,自然灾害,文本分类,机器学习,训练数据 数据概述: 本数据集是用于自然语言处理(NLP)的灾害推文分类任务的更新版训练集,包含了一些简短的推文,并且已经进行了填充处理。数据集中的每条推文都标注了是否与灾害相关,适用于训练灾害推文分类模型。 数据用途概述:... -
维基百科多语言文本识别数据集-2018
维基百科多语言文本识别数据集-2018 数据来源:互联网公开数据 标签:文本识别,多语言,维基百科,自然语言处理,机器学习,语言学,文本分类,数据集 数据概述: WiLI-2018数据集是一个用于评估多语言文本识别任务的基准数据集,包含了来自维基百科的235种语言的235,000个文本段落。该数据集经过精心平衡,并提供了训练集和测试集划分。... -
可疑微博数据集
可疑微博数据集 数据来源:互联网公开数据 标签:社交媒体,文本分类,异常检测,网络安全,内容监管,自然语言处理,情感分析 数据概述 本数据集包含一批经过分类的社交媒体文本数据,主要用于识别和分析可疑内容。数据中的每条记录代表一条微博文本,并根据其是否具有可疑特征被标注为“可疑”或“非可疑”。具体标注规则如下: - 可疑 = 1 - 非可疑 = 0... -
社交媒体虚假声明检测与分类声明数据集
社交媒体虚假声明检测与分类声明数据集 数据来源:互联网公开数据 标签:虚假声明检测,社交媒体,文本分类,深度学习,信息真实性,声明分析,自然语言处理 数据概述: 本数据集旨在解决社交媒体平台上虚假信息和假新闻的传播问题,通过收集和整理声明文本及其相关元数据,构建了一个用于检测虚假声明的结构化数据集。数据集包含以下字段: - ID:唯一标识符 -... -
尼泊尔语文本情感分析数据集
尼泊尔语文本情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,文本分类,自然语言处理,语言学,情感标签 数据概述: 本数据集包含了尼泊尔语的句子,并附带了情感标签。数据集旨在用于尼泊尔语文本的情感分析任务。每个句子都对应一个情感标签,用于区分句子的情感倾向。 情感标签定义如下: 1:正面情感 0:负面情感 2:中性情感 数据用途概述:...