-
IMDB电影剧集情节摘要文本分类数据集
IMDB电影剧集情节摘要文本分类数据集 数据来源:互联网公开数据 标签:IMDB, 电影, 文本分类, 机器学习, 自然语言处理, 类别识别 数据概述: 本数据集包含 1000 条来自 IMDB(Internet Movie Database)的电影/电视剧剧情概要,涵盖 4...
-
路透社新闻专线主题数据集
路透社新闻专线主题数据集 数据来源:互联网公开数据 标签:新闻分类,路透社,媒体分析,NLP,新闻趋势,政治,经济,体育,文化,技术 数据概述: 本数据集基于新闻主题分类数据集,旨在用于新闻分类任务,涵盖了新闻文章的各种特征,如文章长度、关键词频率、文章基调和其它分类指标。数据集中的每篇文章都被标记为五个主要新闻类别之一:政治、经济、体育、文化和技术。...
-
-
-
土耳其客户评论数据集二分类情感分析
土耳其客户评论数据集二分类情感分析 数据来源:互联网公开数据 标签:土耳其语,情感分析,二分类,自然语言处理,客户评论,文本数据,学术研究 数据概述:...
-
沃森翻译增强训练测试数据集
沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...
-
数据2019印度板球联赛IPL比赛评论数据集
数据2019印度板球联赛IPL比赛评论数据集 数据来源:互联网公开数据 标签:板球比赛,印度板球联赛,IPL,实时评论,比赛分析,NLP,文本标注,体育数据 数据概述 本数据集包含2019年印度板球联赛(IPL)所有比赛的球级(ball-level)实时评论数据,以及比赛概要信息。数据来源于ESPN...
-
印度短信垃圾信息检测数据集1963-2021
印度短信垃圾信息检测数据集1963-2021 数据来源:互联网公开数据 标签:短信,垃圾信息检测,文本分类,机器学习,自然语言处理 数据概述:...
-
正常-仇恨和侮辱性言论数据集
正常-仇恨和侮辱性言论数据集 数据来源:互联网公开数据 标签:正常言论,仇恨言论,侮辱性言论,社交媒体分析,文本分析,自然语言处理,社交媒体监控 数据概述:...
-
印度销售交易自然语言处理数据集1963-2021
印度销售交易自然语言处理数据集1963-2021 数据来源:互联网公开数据 标签:销售数据,自然语言处理,文本提取,会计自动化,机器学习,训练数据,客户信息,产品信息,支付方式 数据概述:...
-
托马斯杯2022羽毛球推文数据集
托马斯杯2022羽毛球推文数据集 数据来源:互联网公开数据 标签:托马斯杯,羽毛球,社交媒体,文本分析,情感分析,话题分布,体育赛事,实时分析 数据概述:...
-
Reddit用户抑郁症讨论文本数据集
Reddit用户抑郁症讨论文本数据集 数据来源:互联网公开数据 标签:Reddit,抑郁症,文本数据,情感分析,机器学习,心理健康,社交媒体,数据挖掘 数据概述: 本数据集来源于Reddit平台,由私人在一项使用机器学习技术检测抑郁症的广泛研究项目中整理。 数据通过数据挖掘的方式获取,并经过了简单的数据清洗,以提高数据质量。...
-
电影评论数据集情感分析用
电影评论数据集情感分析用 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,二分类,正面评论,负面评论 数据概述: 本数据集来源于IMDb.com网站,由Bo Pang和Lillian...
-
猴痘疫情社交媒体信息传播分析数据集-2022年7月-8月
猴痘疫情社交媒体信息传播分析数据集-2022年7月-8月 数据来源:互联网公开数据 标签:猴痘,疫情,社交媒体,推特,信息,误导信息,分类,文本分析,公共卫生,健康 数据概述: 本数据集包含两组关于猴痘病毒的推文数据,旨在用于分析社交媒体上猴痘相关信息的传播情况,特别是误导性信息的识别。数据集中的推文均来自推特平台,并经过人工标注,标注方式包括两种:...
-
-
情绪分析-社交媒体文本数据集2015-2023
情绪分析-社交媒体文本数据集2015-2023 数据来源:互联网公开数据 标签:情绪分析,情感识别,社交媒体,文本挖掘,JUUL,电子烟,自然语言处理 数据概述:...
-
基于Transformer的图神经网络与BERT风格瓦片模型预训练数据集
基于Transformer的图神经网络与BERT风格瓦片模型预训练数据集 数据来源:互联网公开数据 标签:Transformer,图神经网络,BERT,预训练模型,模型库,机器学习,自然语言处理,TF-GNN,瓦片模型,开发 数据概述: 本数据集包含了预训练的TF-...
-
-
-
常识问答多选题数据集-CommonsenseQA-通用版
常识问答多选题数据集-CommonsenseQA-通用版 数据来源:互联网公开数据 标签:常识推理,问答系统,多选题,自然语言处理,机器学习,人工智能,知识图谱 数据概述: 本数据集CommonsenseQA是一个多项选择题问答数据集,旨在考察模型对常识知识的理解和推理能力。 数据集包含12,102个问题,每个问题有一个正确答案和四个干扰选项。...



