-
孟加拉语金融词汇情感词典数据集-mdashrafulislam1998
孟加拉语金融词汇情感词典数据集-mdashrafulislam1998 数据来源:互联网公开数据 标签:孟加拉语,金融,情感分析,词典,自然语言处理,文本分析,股票市场,经济,情感词汇 数据概述:... -
大规模文本分类数据集详述
标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。... -
Reddit社区-JUSTNOMIL-子版块用户帖子数据集-gpreda
Reddit社区-JUSTNOMIL-子版块用户帖子数据集-gpreda 数据来源:互联网公开数据 标签:Reddit, JUSTNOMIL, 婆媳关系, 毒性, 家庭关系, 情感, 社区, 文本分析, 情感分析, 话题建模 数据概述: 本数据集收录了来自Reddit社区“JUSTNOMIL”(Just No Mother in... -
Goodreads热门及趋势图书推荐数据集-1896至2021年-nikhil1e9
Goodreads热门及趋势图书推荐数据集-1896至2021年-nikhil1e9 数据来源:互联网公开数据 标签:Goodreads,图书推荐,畅销书,趋势分析,作者研究,文本分析,阅读偏好,文学研究 数据概述:... -
俄罗斯科学文章分类数据集-2011至2021年-ergkerg
俄罗斯科学文章分类数据集-2011至2021年-ergkerg 数据来源:互联网公开数据 标签:俄科学文章,GRNTI分类,文本分析,主题分类,机器学习,教育研究,自然语言处理 数据概述: 本数据集收录了2,478篇俄语科学文章,来源于eLibrary.ru网站,分属62个GRNTI(State Rubricator of Scientific and... -
波兰乐队BraciaFigoFagot歌曲情感分析数据集-fuwiak
波兰乐队BraciaFigoFagot歌曲情感分析数据集-fuwiak 数据来源:互联网公开数据 标签:音乐,情感分析,波兰语,英语,文本分析,Bracia Figo Fagot,音乐情感,歌曲,文化 数据概述: 本数据集收录了波兰乐队Bracia Figo Fagot的歌曲文本及其情感分析结果。数据集包含歌曲名称(nazwa... -
新冠疫情情感分析数据集
新冠疫情情感分析数据集 数据来源:互联网公开数据 标签:情感分析,新冠疫情,社交媒体,推特数据,时间序列,地理位置,文本分析 数据概述: 本数据集源于一次关于印度新冠疫情相关推文情感分析的竞赛,数据主要来源于IEEE DataPort平台提供的推特ID数据集,并通过Hydrator工具提取推文文本及其他相关信息。数据集包含5个字段: 1. 'Text... -
多样化信息分类数据集
标题:多样化信息分类数据集 数据内容:该数据集包含两个主要字段:Category和Message。Category字段有3种不同的值,表示不同的类别;Message字段有5158种不同的值,表示具体的信息内容。数据集中的信息涵盖了多种类型和主题,能够为多种分析和研究提供支持。 数据来源:互联网公开数据... -
俄罗斯文学作品文本数据集
俄罗斯文学作品文本数据集 数据来源:互联网公开数据 标签:文学作品,俄罗斯文学,自然语言处理,文本分类,作者识别,机器学习,不平衡数据,文本分析 数据概述:... -
抑郁症文本分析TF-IDF标准化数据集2021-alexyarbor
抑郁症文本分析TF-IDF标准化数据集2021-alexyarbor 数据来源:互联网公开数据 标签:抑郁症,文本分析,TF-IDF,标准化,Reddit数据,心理健康,机器学习,自然语言处理 数据概述: 本数据集包含经过标准化处理的TF-IDF(词频-逆文档频率)特征矩阵,源自Kaggle上的抑郁症Reddit文本数据集。原始数据集由infamous... -
社交媒体虚假新闻内容识别数据集-abhayku2002
社交媒体虚假新闻内容识别数据集-abhayku2002 数据来源:互联网公开数据 标签:虚假新闻,社交媒体,谣言,信息甄别,文本分析,自然语言处理,机器学习,舆情分析 数据概述:... -
斯瓦希里语句子标注数据集-2023-hassen7
斯瓦希里语句子标注数据集-2023-hassen7 数据来源:互联网公开数据 标签:斯瓦希里语,句子标注,自然语言处理,文本分析,语言学,数据集,语料库 数据概述:... -
Wordle每日单词游戏推特分享数据-2022年1月1日至11月15日
Wordle每日单词游戏推特分享数据-2022年1月1日至11月15日 数据来源:互联网公开数据 标签:Wordle, 单词游戏, 推特, 社交媒体, 游戏分析, 数据挖掘, 文本分析, 游戏数据 数据概述:... -
印度尼西亚与爪哇语自然语言推理跨语言数据集-202X-jalaluddinalmursyidy
印度尼西亚与爪哇语自然语言推理跨语言数据集-202X-jalaluddinalmursyidy 数据来源:互联网公开数据 标签:NLI,自然语言推理,跨语言,印度尼西亚,爪哇语,Ngoko,文本分析,数据集 数据概述:... -
电子商务嘈杂评论文本规范化数据集-sakshijain23
电子商务嘈杂评论文本规范化数据集-sakshijain23 数据来源:互联网公开数据 标签:电商评论,文本规范化,自然语言处理,短语识别,数据清洗,文本分析 数据概述:... -
Shopify电商商店描述与分类数据集
Shopify电商商店描述与分类数据集 数据来源:互联网公开数据 标签:Shopify,电商,商店,NLP,文本分析,分类,半监督学习,多标签分类,网页抓取 数据概述: 本数据集包含了61.8万个Shopify在线商店的信息。对于每个商店,我们提供了其标题、描述以及商品集合列表,这些数据均从商店的HTML主页中抓取获得(详见 shopgram.io... -
虚假新闻识别训练与测试数据集2023-marwanelmahalawy
虚假新闻识别训练与测试数据集2023-marwanelmahalawy 数据来源:互联网公开数据 标签:假新闻,新闻识别,训练数据,测试数据,文本分析,机器学习 数据概述:... -
科学家与公众人物推文数据集
科学家与公众人物推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,科学家,公众人物,时间序列,文本分析,自然语言处理 数据概述 本数据集包含来自多位活跃科学家和公众人物的推文记录,涵盖了从唐纳德·特朗普(Donald Trump)和希拉里·克林顿(Hillary Clinton)到尼尔·德格拉斯·泰森(Neil deGrasse... -
孟加拉语怀疑性评论数据集-2023-meherunnesashraboni
孟加拉语怀疑性评论数据集-2023-meherunnesashraboni 数据来源:互联网公开数据 标签:孟加拉语,怀疑性评论,社交媒体,文本分析,数据科学,人工审查,数据收集 数据概述:... -
数据2018年3月4日Twitter黑豹电影相关推文数据集-farisai
2018年3月4日Twitter黑豹电影相关推文数据集-farisai 数据来源:互联网公开数据 标签:推特,黑豹电影, Wakanda,文本分析,情感分析,数据清洗,文本分类 数据概述: 本数据集包含2018年3月4日使用Twitter流媒体API收集的有关“Wakanda”和“Black...