-
IMDB顶级电影数据集
IMDB顶级电影数据集 数据来源:互联网公开数据 标签:电影,IMDB,评分,电影信息,电影分析,影视产业,观众偏好 数据概述: 本数据集包含了在IMDB网站上评分最高的电影信息,涵盖了多个年份的电影数据。数据集中的每一部电影都提供了包括标题、年份、评分、导演、演员、类型、简介等在内的详细信息,为电影产业分析和观众偏好研究提供了丰富的数据支持。...
-
Reddit平台自杀相关讨论内容数据集
Reddit平台自杀相关讨论内容数据集 数据来源:互联网公开数据 标签:Reddit,社交媒体,自杀,心理健康,文本分析,情感分析,网络社区,负面情绪,情感识别 数据概述: 本数据集通过browse.ai的网络爬取技术,收集了Reddit平台上关于自杀讨论的帖子,共包含500条记录。...
-
BBC新闻文本分类与主题分析数据集2004-2005
BBC新闻文本分类与主题分析数据集2004-2005 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,自然语言处理,BBC新闻,分类模型,主题分析,语言处理技术 数据概述:...
-
合成蟹类数据集
合成蟹类数据集 数据来源:互联网公开数据 标签:合成数据,蟹类,平衡数据集,机器学习,数据竞赛 数据概述: 本数据集是由特定Notebook生成的合成蟹类数据,旨在提供一个平衡的数据集用于数据分析和机器学习竞赛。该数据集基于原始收集的数据生成,确保了类别之间的均衡分布,适用于各种分类和回归分析任务。 数据用途概述:...
-
亚马逊商品评论与评分预测数据集
亚马逊商品评论与评分预测数据集 数据来源:互联网公开数据 标签:亚马逊,评论分析,情感分析,评分预测,文本分类,电子商务,机器学习 数据概述 本数据集来源于亚马逊网站,通过爬取亚马逊商品的用户评论及其对应的评分构建而成。数据集包含约50,000条商品评论及其对应的5分制评分。每条记录主要包含以下两个关键字段: 1....
-
推特用户性别预测数据集
推特用户性别预测数据集 数据来源:互联网公开数据 标签:推特,性别预测,自然语言处理,机器学习,文本分析,社会语言学,性别识别 数据概述: 本数据集包含2019年5月21日至2019年6月1日期间通过Twitter...
-
星际之门-SG-1剧本语料库
星际之门-SG-1剧本语料库 数据来源:互联网公开数据 标签:星际之门,SG-1,剧本,对话,电视剧,文本分析,文化研究,语言研究 数据概述: 本数据集包含了星际之门:SG-1从第一季到第六季(直到丹尼尔升天且不再为主要角色)的所有对话和指令内容。数据集覆盖了超过5年的电视剧集,为研究电视剧中的对话模式、角色互动及文化背景提供了丰富的文本材料。...
-
ADAUSD每日交易数据集1963-2021
ADAUSD每日交易数据集1963-2021 数据来源:互联网公开数据 标签:ADAUSD,每日交易数据,综合指数,时间序列,机器学习,数据分析,加密货币 数据概述:...
-
EC类混合酶-底物关系预测数据集
EC类混合酶-底物关系预测数据集 数据来源:互联网公开数据 标签:酶学,EC分类,底物预测,机器学习,化学信息,结构信息,数据不平衡 数据概述: 本数据集包含酶-...
-
葡萄酒质量预测数据集
葡萄酒质量预测数据集 数据来源:互联网公开数据 标签:葡萄酒,质量预测,机器学习,物流回归,分类,回归任务,葡萄酒质量评分,品酒,化学成分,感官评价 数据概述: 本数据集包含葡萄牙“Vinho...
-
FIL-AUD市场历史数据集
FIL-AUD市场历史数据集 数据来源:互联网公开数据 标签:加密货币,市场数据,交易历史,OHLCVT,算法交易,市场趋势,预测分析 数据概述: 本数据集包含从Kraken交易所FIL-...
-
摩门经信息提取版数据集
摩门经信息提取版数据集 数据来源:互联网公开数据 标签:摩门经,宗教文本,自然语言处理,主题建模,文本研究,文化研究 数据概述: 该数据集包含了《摩门经》的文本内容,该文本来源于美国在线图书馆的Project...
-
完整宝可梦数据集
完整宝可梦数据集 数据来源:互联网公开数据 标签:宝可梦,数据可视化,游戏数据,数据清洗,网络爬虫,数据集更新,宝可梦类型,宝可梦能力,宝可梦进化 数据概述: 本数据集包含宝可梦从第一代到第八代的完整信息,包括新扩展的《宝可梦 剑与盾》DLC和《宝可梦 传说...
-
TMDB5000电影数据集
TMDB5000电影数据集 数据来源:互联网公开数据 标签:电影,电影数据库,票房,预算,语言,类型,上映日期,流行度,电影分析,娱乐行业 数据概述: 本数据集包含超过5000部电影的详细信息,数据来源于The Movie Database...
-
Reddit宝可梦社区帖子主题与用户互动分析数据集
Reddit宝可梦社区帖子主题与用户互动分析数据集 数据来源:互联网公开数据 标签:宝可梦,Reddit,社交媒体,用户互动,帖子分析,主题挖掘,社区,游戏,流行趋势 数据概述:...
-
威斯康星州乳腺癌诊断数据集-诊断分析与预测研究
威斯康星州乳腺癌诊断数据集-诊断分析与预测研究 数据来源:互联网公开数据 标签:乳腺癌,诊断,肿瘤,医学,机器学习,预测,特征,病理,良性,恶性 数据概述:...
-
信用风险评估预测比赛用户申请数据集-2021年5月
信用风险评估预测比赛用户申请数据集-2021年5月 数据来源:互联网公开数据 标签:信用风险,用户申请,预测,机器学习,比赛数据,金融,信贷,客户行为 数据概述: 本数据集来源于Analytics Vidhya平台举办的“信用风险评估预测比赛”,旨在帮助参赛者构建预测模型,评估用户申请信用卡的风险。数据集包含训练集、测试集以及一个样本提交文件。...
-
TMDB最受欢迎电视剧数据分析集
TMDB最受欢迎电视剧数据分析集 数据来源:互联网公开数据 标签:电视剧,流行文化,数据分析,推荐系统,趋势分析,评分,观众偏好 数据概述: 本数据集收录了来自TMDB(The Movie...
-
-
Kaggle平台用户活跃度排名Top1000数据集-竞赛-数据集-笔记本-讨论-2021年10月至2023年9月
Kaggle平台用户活跃度排名Top1000数据集-竞赛-数据集-笔记本-讨论-2021年10月至2023年9月 数据来源:互联网公开数据 标签:Kaggle,排名,用户,竞赛,数据集,笔记本,讨论,数据分析,社区活跃度,时间序列 数据概述:...



