-
-
印度尼西亚短信垃圾信息数据集
印度尼西亚短信垃圾信息数据集 数据来源:互联网公开数据 标签:短信,垃圾信息,分类,文本分析,机器学习,印尼语 数据概述: 本数据集来源于https://yudiwbs.wordpress.com/2018/08/05/dataset-klasifikasi-bahasa-indonesia-sms-spam-klasifikasi-teks-... -
华尔街赌场Reddit帖子数据集
华尔街赌场Reddit帖子数据集 数据来源:互联网公开数据 标签:华尔街赌场,Reddit,社交媒体,股票,投资,金融,社区,帖子,文本分析,情绪分析 数据概述:... -
福尔德家族故事集情感分析数据集
福尔德家族故事集情感分析数据集 数据来源:互联网公开数据 标签:情感分析,文本分析,自然语言处理,福尔德家族,故事集,词频分析,情感词典,主题建模,实体识别 数据概述:... -
多模态情感数据集
多模态情感数据集 数据来源:互联网公开数据 标签:多模态,情感分析,图像识别,自然语言处理,计算机视觉,图像分类,文本分析 数据概述: 本数据集包含100个不同类别动物和物体的图像及其对应的文本描述和情感标签,适用于多模态情感分析研究。图像类别包括鲨鱼、鸟类、蜥蜴、蜘蛛等。该数据集为计算机视觉和自然语言处理任务提供了丰富的数据资源。 数据用途概述:... -
在线新闻聚类分析数据集2021
在线新闻聚类分析数据集2021 数据来源:互联网公开数据 标签:在线新闻,聚类分析,K均值聚类,层次聚类,新闻分类,数据挖掘,文本分析 数据概述: 本数据集包含2021年在线新闻的文章数据,涵盖新闻的主题、内容摘要、发布日期、作者、类别等多种信息。数据集旨在为新闻分类和聚类分析提供丰富的源数据,支持不同类型的文本处理研究。 数据用途概述:... -
印度尼西亚垃圾短信文本分析数据集1963-2021
印度尼西亚垃圾短信文本分析数据集1963-2021 数据来源:互联网公开数据 标签:垃圾短信,文本分析,商业用途,欺诈检测,客户支持,趋势分析,教育,网络安全,短信分类,机器学习,自然语言处理 数据概述:... -
微博头像数据集
微博头像数据集 数据来源:互联网公开数据 标签:微博,社交媒体,头像,文本分析,TF-IDF,Bert,话题识别 数据概述: 本数据集包含从微博爬取的CSV文件和使用TF-... -
-
推特情绪强度分析数据集1963-2021
推特情绪强度分析数据集1963-2021 数据来源:互联网公开数据 标签:情绪分析,推特,情感强度,情绪分类,自然语言处理,文本分析,社交媒体分析 数据概述:... -
印度法律与法案数据集1074-至今
印度法律与法案数据集1074-至今 数据来源:互联网公开数据 标签:印度法律,法案,历史,法律研究,文本分析,语言模型,政策分析 数据概述:... -
文档评论意图分类数据集
文档评论意图分类数据集 数据来源:互联网公开数据 标签:文档评论,意图分类,CommonCrawl,文本分析,自然语言处理,商务文档,交互分析 数据概述:... -
土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2
土耳其学术期刊机器学习与人工智能论文摘要数据集-DergiPark网站-v2 数据来源:互联网公开数据 标签:机器学习,深度学习,迁移学习,人工智能,论文摘要,土耳其,学术期刊,自然语言处理,文本分析 数据概述:... -
奥斯卡颁奖典礼获奖感言文本数据集-1940至今
奥斯卡颁奖典礼获奖感言文本数据集-1940至今 数据来源:互联网公开数据 标签:奥斯卡,颁奖典礼,获奖感言,电影,文本分析,情感分析,自然语言处理,文化研究 数据概述:... -
阿瓦米阿瓦兹-信德语文章分类数据集
阿瓦米阿瓦兹-信德语文章分类数据集 数据来源:互联网公开数据 标签:信德语,文章分类,NLP,文本分析,数据科学,机器学习,词云,探索性分析 数据概述:... -
常用表情符号编码与描述数据集
常用表情符号编码与描述数据集 数据来源:互联网公开数据 标签:表情符号,emoji,Unicode,编码,描述,文本分析,社交媒体 数据概述: 本数据集包含一个CSV文件,共计4236行(包括标题行)。文件提供了广泛使用的表情符号(emoji)的详细信息,涵盖了表情符号的名称、Unicode编码点、图形表示、简要描述以及Unicode版本等关键属性。... -
社交媒体仇恨言论识别数据集-文本内容-2017
社交媒体仇恨言论识别数据集-文本内容-2017 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,情感分析,自然语言处理,语言学,数据标注,分类,攻击性语言 数据概述: 本数据集包含近1.5万条短文本,每条文本均由多位贡献者进行标注,以识别其是否包含仇恨言论。标注结果分为三类:a) 包含仇恨言论;b) 具有攻击性,但不属于仇恨言论;c)... -
伊斯兰国宗教文本数据集2014-2017
伊斯兰国宗教文本数据集2014-2017 数据来源:互联网公开数据 标签:伊斯兰国,宗教文本,宣传材料,招募,意识形态,反恐研究,文本分析 数据概述:... -
奥罗莫语句子标注数据集
奥罗莫语句子标注数据集 数据来源:互联网公开数据 标签:奥罗莫语,句子标注,自然语言处理,文本分析,语言识别 数据概述: 本数据集包含78,000条经过清理的奥罗莫语句子,所有句子均无特殊字符和标点符号。数据集由两列组成,其中一列包含句子文本,另一列包含对应的语言标签。该数据集为研究和处理奥罗莫语提供了丰富的语言素材。 数据用途概述:... -
贝叶斯方法与机器学习书籍主题建模数据集
贝叶斯方法与机器学习书籍主题建模数据集 数据来源:互联网公开数据 标签:机器学习,贝叶斯方法,主题建模,文本分析,自然语言处理,书籍,数据挖掘,Bishop 数据概述: 本数据集包含了《模式识别与机器学习》(Pattern Recognition and Machine Learning)一书(作者:Christopher...