找到60,800个数据集

标签: 开发者

过滤结果
  • IMDB顶级电影数据集

    2025年4月14日   

    IMDB顶级电影数据集 数据来源:互联网公开数据 标签:电影,IMDB,评分,电影信息,电影分析,影视产业,观众偏好 数据概述: 本数据集包含了在IMDB网站上评分最高的电影信息,涵盖了多个年份的电影数据。数据集中的每一部电影都提供了包括标题、年份、评分、导演、演员、类型、简介等在内的详细信息,为电影产业分析和观众偏好研究提供了丰富的数据支持。...
    packageimg
  • Reddit平台自杀相关讨论内容数据集

    2025年4月14日   

    Reddit平台自杀相关讨论内容数据集 数据来源:互联网公开数据 标签:Reddit,社交媒体,自杀,心理健康,文本分析,情感分析,网络社区,负面情绪,情感识别 数据概述: 本数据集通过browse.ai的网络爬取技术,收集了Reddit平台上关于自杀讨论的帖子,共包含500条记录。...
    packageimg
  • BBC新闻文本分类与主题分析数据集2004-2005

    2025年4月14日   

    BBC新闻文本分类与主题分析数据集2004-2005 数据来源:互联网公开数据 标签:新闻分类,文本挖掘,自然语言处理,BBC新闻,分类模型,主题分析,语言处理技术 数据概述:...
    packageimg
  • 合成蟹类数据集

    2025年4月14日   

    合成蟹类数据集 数据来源:互联网公开数据 标签:合成数据,蟹类,平衡数据集,机器学习,数据竞赛 数据概述: 本数据集是由特定Notebook生成的合成蟹类数据,旨在提供一个平衡的数据集用于数据分析和机器学习竞赛。该数据集基于原始收集的数据生成,确保了类别之间的均衡分布,适用于各种分类和回归分析任务。 数据用途概述:...
    packageimg
  • 亚马逊商品评论与评分预测数据集

    2025年4月14日   

    亚马逊商品评论与评分预测数据集 数据来源:互联网公开数据 标签:亚马逊,评论分析,情感分析,评分预测,文本分类,电子商务,机器学习 数据概述 本数据集来源于亚马逊网站,通过爬取亚马逊商品的用户评论及其对应的评分构建而成。数据集包含约50,000条商品评论及其对应的5分制评分。每条记录主要包含以下两个关键字段: 1....
    packageimg
  • 推特用户性别预测数据集

    2025年4月14日   

    推特用户性别预测数据集 数据来源:互联网公开数据 标签:推特,性别预测,自然语言处理,机器学习,文本分析,社会语言学,性别识别 数据概述: 本数据集包含2019年5月21日至2019年6月1日期间通过Twitter...
    packageimg
  • 星际之门-SG-1剧本语料库

    2025年4月14日   

    星际之门-SG-1剧本语料库 数据来源:互联网公开数据 标签:星际之门,SG-1,剧本,对话,电视剧,文本分析,文化研究,语言研究 数据概述: 本数据集包含了星际之门:SG-1从第一季到第六季(直到丹尼尔升天且不再为主要角色)的所有对话和指令内容。数据集覆盖了超过5年的电视剧集,为研究电视剧中的对话模式、角色互动及文化背景提供了丰富的文本材料。...
    packageimg
  • ADAUSD每日交易数据集1963-2021

    2025年4月14日   

    ADAUSD每日交易数据集1963-2021 数据来源:互联网公开数据 标签:ADAUSD,每日交易数据,综合指数,时间序列,机器学习,数据分析,加密货币 数据概述:...
    packageimg
  • EC类混合酶-底物关系预测数据集

    2025年4月14日   

    EC类混合酶-底物关系预测数据集 数据来源:互联网公开数据 标签:酶学,EC分类,底物预测,机器学习,化学信息,结构信息,数据不平衡 数据概述: 本数据集包含酶-...
    packageimg
  • 葡萄酒质量预测数据集

    2025年4月14日   

    葡萄酒质量预测数据集 数据来源:互联网公开数据 标签:葡萄酒,质量预测,机器学习,物流回归,分类,回归任务,葡萄酒质量评分,品酒,化学成分,感官评价 数据概述: 本数据集包含葡萄牙“Vinho...
    packageimg
  • FIL-AUD市场历史数据集

    2025年4月14日   

    FIL-AUD市场历史数据集 数据来源:互联网公开数据 标签:加密货币,市场数据,交易历史,OHLCVT,算法交易,市场趋势,预测分析 数据概述: 本数据集包含从Kraken交易所FIL-...
    packageimg
  • 摩门经信息提取版数据集

    2025年4月14日   

    摩门经信息提取版数据集 数据来源:互联网公开数据 标签:摩门经,宗教文本,自然语言处理,主题建模,文本研究,文化研究 数据概述: 该数据集包含了《摩门经》的文本内容,该文本来源于美国在线图书馆的Project...
    packageimg
  • 完整宝可梦数据集

    2025年4月14日   

    完整宝可梦数据集 数据来源:互联网公开数据 标签:宝可梦,数据可视化,游戏数据,数据清洗,网络爬虫,数据集更新,宝可梦类型,宝可梦能力,宝可梦进化 数据概述: 本数据集包含宝可梦从第一代到第八代的完整信息,包括新扩展的《宝可梦 剑与盾》DLC和《宝可梦 传说...
    packageimg
  • TMDB5000电影数据集

    2025年4月14日   

    TMDB5000电影数据集 数据来源:互联网公开数据 标签:电影,电影数据库,票房,预算,语言,类型,上映日期,流行度,电影分析,娱乐行业 数据概述: 本数据集包含超过5000部电影的详细信息,数据来源于The Movie Database...
    packageimg
  • Reddit宝可梦社区帖子主题与用户互动分析数据集

    2025年4月14日   

    Reddit宝可梦社区帖子主题与用户互动分析数据集 数据来源:互联网公开数据 标签:宝可梦,Reddit,社交媒体,用户互动,帖子分析,主题挖掘,社区,游戏,流行趋势 数据概述:...
    packageimg
  • 威斯康星州乳腺癌诊断数据集-诊断分析与预测研究

    2025年4月14日   

    威斯康星州乳腺癌诊断数据集-诊断分析与预测研究 数据来源:互联网公开数据 标签:乳腺癌,诊断,肿瘤,医学,机器学习,预测,特征,病理,良性,恶性 数据概述:...
    packageimg
  • 信用风险评估预测比赛用户申请数据集-2021年5月

    2025年4月14日   

    信用风险评估预测比赛用户申请数据集-2021年5月 数据来源:互联网公开数据 标签:信用风险,用户申请,预测,机器学习,比赛数据,金融,信贷,客户行为 数据概述: 本数据集来源于Analytics Vidhya平台举办的“信用风险评估预测比赛”,旨在帮助参赛者构建预测模型,评估用户申请信用卡的风险。数据集包含训练集、测试集以及一个样本提交文件。...
    packageimg
  • TMDB最受欢迎电视剧数据分析集

    2025年4月14日   

    TMDB最受欢迎电视剧数据分析集 数据来源:互联网公开数据 标签:电视剧,流行文化,数据分析,推荐系统,趋势分析,评分,观众偏好 数据概述: 本数据集收录了来自TMDB(The Movie...
    packageimg
  • 越南语关系抽取数据集

    2025年4月14日   

    越南语关系抽取数据集 数据来源:互联网公开数据 标签:越南语,自然语言处理,关系抽取,实体识别,文本分析,机器学习,语义理解 数据概述:...
    packageimg
  • Kaggle平台用户活跃度排名Top1000数据集-竞赛-数据集-笔记本-讨论-2021年10月至2023年9月

    2025年4月14日   

    Kaggle平台用户活跃度排名Top1000数据集-竞赛-数据集-笔记本-讨论-2021年10月至2023年9月 数据来源:互联网公开数据 标签:Kaggle,排名,用户,竞赛,数据集,笔记本,讨论,数据分析,社区活跃度,时间序列 数据概述:...
    packageimg