-
文档评论意图分类数据集
文档评论意图分类数据集 数据来源:互联网公开数据 标签:文档评论,意图分类,CommonCrawl,文本分析,自然语言处理,商务文档,交互分析 数据概述:... -
土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2
土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2 数据来源:互联网公开数据 标签:机器学习,深度学习,迁移学习,人工智能,论文摘要,土耳其,学术期刊,自然语言处理,文本分析 数据概述:... -
奥斯卡颁奖典礼获奖感言文本数据集-1940至今
奥斯卡颁奖典礼获奖感言文本数据集-1940至今 数据来源:互联网公开数据 标签:奥斯卡,颁奖典礼,获奖感言,电影,文本分析,情感分析,自然语言处理,文化研究 数据概述:... -
阿瓦米阿瓦兹-信德语文章分类数据集
阿瓦米阿瓦兹-信德语文章分类数据集 数据来源:互联网公开数据 标签:信德语,文章分类,NLP,文本分析,数据科学,机器学习,词云,探索性分析 数据概述:... -
常用表情符号编码与描述数据集
常用表情符号编码与描述数据集 数据来源:互联网公开数据 标签:表情符号,emoji,Unicode,编码,描述,文本分析,社交媒体 数据概述: 本数据集包含一个CSV文件,共计4236行(包括标题行)。文件提供了广泛使用的表情符号(emoji)的详细信息,涵盖了表情符号的名称、Unicode编码点、图形表示、简要描述以及Unicode版本等关键属性。... -
社交媒体仇恨言论识别数据集-文本内容-2017
社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)... -
伊斯兰国宗教文本数据集2014-2017
伊斯兰国宗教文本数据集2014-2017 数据来源:互联网公开数据 标签:伊斯兰国,宗教文本,宣传材料,招募,意识形态,反恐研究,文本分析 数据概述:... -
奥罗莫语句子标注数据集
奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:... -
贝叶斯方法与机器学习书籍主题建模数据集
贝叶斯方法与机器学习书籍主题建模数据集 数据来源:互联网公开数据 标签:机器学习,贝叶斯方法,主题建模,文本分析,自然语言处理,书籍,数据挖掘,Bishop 数据概述: 本数据集包含了《模式识别与机器学习》(Pattern Recognition and Machine Learning)一书(作者:Christopher... -
不明飞行物目击事件词序模式数据集
不明飞行物目击事件词序模式数据集 数据来源:互联网公开数据 标签:不明飞行物,词序模式,NLP,文本分析,UFO,目击报告,模式识别 数据概述: 本数据集来源于NUFORC的不明飞行物目击事件数据库,包含了通过https://github.com/jacksonkarel/nlp-... -
推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证
推特用户情感分析数据集-社交媒体内容情感分类-多实体-训练验证 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,社交媒体,情感分类,机器学习,文本分析,训练集,验证集 数据概述: 本数据集用于推特(Twitter)用户情感分析,旨在对推特消息中针对特定实体的情感倾向进行分类。... -
-
在线新闻文章分享量预测数据集-Mashable平台-2015年
在线新闻文章分享量预测数据集-Mashable平台-2015年 数据来源:互联网公开数据 标签:新闻,社交媒体,文章,分享量,预测,机器学习,文本分析,Mashable,内容分析 数据概述:... -
斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-
斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -... -
英超梦幻联赛Reddit社区讨论内容数据集
英超梦幻联赛Reddit社区讨论内容数据集 数据来源:互联网公开数据 标签:足球,英超,梦幻联赛,Reddit,社交媒体,文本分析,情感分析,社区讨论,数据挖掘 数据概述: 本数据集收录了来自Reddit社区r/FantasyPL的帖子和评论,该社区主要讨论英超梦幻联赛(Fantasy Premier League)。数据通过Python Reddit... -
神经信息处理系统大会论文提交数据集NeurIPS2016-2019
神经信息处理系统大会论文提交数据集NeurIPS2016-2019 数据来源:互联网公开数据 标签:NeurIPS,机器学习,计算神经科学,论文,学术会议,文本分析,自然语言处理,主题建模,聚类,分类 数据概述:... -
孟加拉语维基百科语料库数据集
孟加拉语维基百科语料库数据集 数据来源:互联网公开数据 标签:孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库 数据概述:... -
-
-
印度尼西亚垃圾邮件检测电子邮件数据集1963-2021
印度尼西亚垃圾邮件检测电子邮件数据集1963-2021 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,分类,文本分析,网络安全,数据清洗,特征提取 数据概述:...