数据集 - 海数据

表情符号描述与释义数据集

2025年4月14日

表情符号描述与释义数据集数据来源：互联网公开数据标签：表情符号,Emoji,释义,情感分析,文本分析,社交媒体,符号学,数据挖掘数据概述：...

ZIP

在线新闻文章分享量预测数据集-Mashable平台-2015年

2025年4月14日

在线新闻文章分享量预测数据集-Mashable平台-2015年数据来源：互联网公开数据标签：新闻,社交媒体,文章,分享量,预测,机器学习,文本分析,Mashable,内容分析数据概述：...

ZIP

斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

2025年4月14日

斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源：互联网公开数据标签：问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译数据概述：本数据集是针对“chaii -...

ZIP

英超梦幻联赛Reddit社区讨论内容数据集

2025年4月14日

英超梦幻联赛Reddit社区讨论内容数据集数据来源：互联网公开数据标签：足球,英超,梦幻联赛,Reddit,社交媒体,文本分析,情感分析,社区讨论,数据挖掘数据概述：本数据集收录了来自Reddit社区r/FantasyPL的帖子和评论，该社区主要讨论英超梦幻联赛（Fantasy Premier League）。数据通过Python Reddit...

ZIP

神经信息处理系统大会论文提交数据集NeurIPS2016-2019

2025年4月14日

神经信息处理系统大会论文提交数据集NeurIPS2016-2019 数据来源：互联网公开数据标签：NeurIPS,机器学习,计算神经科学,论文,学术会议,文本分析,自然语言处理,主题建模,聚类,分类数据概述：...

ZIP

孟加拉语维基百科语料库数据集

2025年4月14日

孟加拉语维基百科语料库数据集数据来源：互联网公开数据标签：孟加拉语,维基百科,自然语言处理,NLP,文本分析,机器学习,语料库数据概述：...

ZIP

多标签分类新闻类别数据集

2025年4月14日

多标签分类新闻类别数据集数据来源：互联网公开数据标签：多标签分类,新闻类别,文本分析,机器学习,自然语言处理,信息提取,数据标注数据概述：...

ZIP

洛杉矶推特新闻数据集

2025年4月14日

洛杉矶推特新闻数据集数据来源：互联网公开数据标签：洛杉矶,推特,新闻,分类,自然语言处理,NLP,文本分析数据概述：...

ZIP

印度尼西亚垃圾邮件检测电子邮件数据集1963-2021

2025年4月14日

印度尼西亚垃圾邮件检测电子邮件数据集1963-2021 数据来源：互联网公开数据标签：垃圾邮件,电子邮件,分类,文本分析,网络安全,数据清洗,特征提取数据概述：...

ZIP

情景喜剧宋飞正传剧本对话数据集

2025年4月14日

情景喜剧宋飞正传剧本对话数据集数据来源：互联网公开数据标签：宋飞正传,情景喜剧,剧本,对话,角色,文本分析,喜剧,电视剧数据概述：本数据集包含了美国经典情景喜剧《宋飞正传》（Seinfeld）的剧本对话内容，涵盖了该剧所有季的剧集。数据集的核心内容是剧中的角色对话，以及相关的剧集和季节信息。数据以结构化的形式呈现，方便用户进行分析和探索。...