找到151个数据集

标签: 数据清理

过滤结果
  • 电信客户流失清理数据集

    2025年4月15日   

    电信客户流失清理数据集 数据来源:互联网公开数据 标签:电信客户,客户流失,客户服务,用户行为,数据清理,预测分析,客户满意度 数据概述:...
    packageimg
  • 电影数据库电影信息数据集1960-2023

    2025年4月15日   

    电影数据库电影信息数据集1960-2023 数据来源:互联网公开数据 标签:电影,电影数据库,电影信息,数据清理,推荐系统,数据分析,机器学习 数据概述:...
    packageimg
  • 行为推特数据集

    2025年4月15日   

    行为推特数据集 数据来源:互联网公开数据 标签:社交媒体,心理健康,压力,孤独,焦虑,数据清理,NLTK,情感分析 数据概述: 本数据集通过Tweepy...
    packageimg
  • CIBMRT清理后的数据集

    2025年4月15日   

    CIBMRT清理后的数据集 数据来源:互联网公开数据 标签:CIBMRT,数据清理,机器学习,预测建模,探索性数据分析,医疗数据,移植数据 数据概述: 本数据集来自于Kaggle上的CIBMTR比赛数据集。数据预处理的主要 focus...
    packageimg
  • 未清理智能手机数据集

    2025年4月15日   

    未清理智能手机数据集 数据来源:互联网公开数据 标签:智能手机,数据清理,价格,评分,处理器,内存,摄像头,操作系统 数据概述: 本数据集收录了不同型号智能手机的原始未清理数据,涵盖了约20列关键信息,包括手机型号、价格、用户评分、SIM卡支持类型、处理器信息、RAM配置、摄像头像素以及操作系统等。数据集为智能手机市场研究提供了丰富的原始数据支持。...
    packageimg
  • 社交媒体数据样本

    2025年4月15日   

    社交媒体数据样本 数据来源:互联网公开数据 标签:社交媒体,Instagram,Facebook,TikTok,YouTube,数据清理,文本分析,用户行为,内容分析 数据概述:...
    packageimg
  • 达特游戏练习数据集

    2025年4月15日   

    达特游戏练习数据集 数据来源:互联网公开数据 标签:达特游戏,501规则,练习记录,数据清理,游戏分析 数据概述: 本数据集收录了使用501规则进行练习的达特游戏记录,涵盖2023年3月21日之前的所有完整轮次游戏,数据通过手动记录并使用R语言进行处理,去除了少量不完整的游戏记录(截至2023年3月21日,共去除三局)。 数据用途概述:...
    packageimg
  • 慈善捐赠者识别数据集1996

    2025年4月15日   

    慈善捐赠者识别数据集1996 数据来源:互联网公开数据 标签:慈善捐赠,数据挖掘,机器学习,分类模型,特征选择,数据清理 数据概述: 本数据集源自UCI机器学习库,由Ron Kohavi和Barry...
    packageimg
  • 印度尼西亚期权链数据集

    2025年4月15日   

    印度尼西亚期权链数据集 数据来源:互联网公开数据 标签:期权链,印度尼西亚,股票市场,金融分析,数据清理,数据可视化,期权策略 数据概述:...
    packageimg
  • 来自X的仇恨言论和冒犯性语言数据集

    2025年4月15日   

    来自X的仇恨言论和冒犯性语言数据集 数据来源:互联网公开数据 标签:仇恨言论,冒犯性语言,社交媒体数据,文本分析,自然语言处理,三元分类,数据清理 数据概述: 本数据集通过名为“Instant Data...
    packageimg
  • 甘蔗生产数据集

    2025年4月15日   

    甘蔗生产数据集 数据来源:互联网公开数据 标签:甘蔗,生产,卡纳塔克邦,农业,产量,地理分布,数据清理 数据概述: 本数据集包含了卡纳塔克邦30个地区的甘蔗生产数据,记录了各地区的甘蔗产量等信息。数据中存在空单元格,因此在使用前需要进行数据清洗处理。该数据集为研究卡纳塔克邦甘蔗生产提供了详细的数据支持。 数据用途概述:...
    packageimg
  • 纽约市2024年职位发布数据集

    2025年4月15日   

    纽约市2024年职位发布数据集 数据来源:互联网公开数据 标签:纽约市,职位发布,政府机构,就业分析,数据清理,薪资范围,工作地点 数据概述:...
    packageimg
  • 巴西姓名按性别分类数据集

    2025年4月15日   

    巴西姓名按性别分类数据集 数据来源:互联网公开数据 标签:巴西,姓名,性别分类,数据清理,数据分析,人口统计,教育研究 数据概述: 本数据集收录了巴西数千名大学毕业生的姓名及其对应的性别信息,数据涵盖1963年至2021年间的数据。原始数据经过清洗和整理,确保了数据的准确性和可靠性。数据集为研究巴西人口统计特征、性别分布以及教育领域提供了基础数据支持。...
    packageimg
  • 房价预测清理数据集

    2025年4月15日   

    房价预测清理数据集 数据来源:互联网公开数据 标签:房价预测,数据清理,机器学习,模型训练,竞赛数据,房地产分析 数据概述: 本数据集来源于Kaggle房价预测竞赛的数据集,适合初学者和高级用户使用。该数据集已经完成了数据清理工作,解决了缺失值、异常值和数据偏斜的问题,为快速构建和评估预测模型提供了干净的数据基础。 数据用途概述:...
    packageimg
  • 美国麻萨诸塞州大规模枪击事件数据集

    2025年4月15日   

    美国麻萨诸塞州大规模枪击事件数据集 数据来源:互联网公开数据 标签:大规模枪击事件,美国,麻萨诸塞州,公共安全,地理信息,数据清理 数据概述: 本数据集是https://www.kaggle.com/zusmani/us-mass-shootings-...
    packageimg
  • NSU咨询数据集

    2025年4月15日   

    NSU咨询数据集 数据来源:互联网公开数据 标签:NSU,咨询,课程信息,教师,时间安排,学期,数据清理 数据概述: 本数据集包含新泽西州立大学(NSU)所有可用的课程小节详情,包括课程名称、教师姓名缩写、上课时间及学期名称等信息。数据来源于公开渠道,但由于部分信息尚未确定,数据集中存在大量缺失值(以TBA表示)。使用数据前,请确保对数据进行清理。...
    packageimg
  • 加州野生动物清理数据集2025年1月

    2025年4月15日   

    加州野生动物清理数据集2025年1月 数据来源:互联网公开数据 标签:加州,野生动物,数据清理,时间序列,生态研究,环境监测,生物多样性 数据概述:...
    packageimg
  • Reddit抑郁主题清理文本数据集-2021

    2025年4月15日   

    Reddit抑郁主题清理文本数据集-2021 数据来源:互联网公开数据 标签:Reddit,抑郁,文本生成,数据清理,心理健康,社交媒体,文本数据 数据概述:...
    packageimg
  • 布鲁塞尔租房月租金数据集

    2025年4月15日   

    布鲁塞尔租房月租金数据集 数据来源:互联网公开数据 标签:布鲁塞尔,租房,月租金,数据清理,缺失数据处理,回归分析 数据概述: 本数据集包含了布鲁塞尔自2023年初以来的所有租房列表信息,数据格式较为杂乱。数据集涵盖了租房的各种相关信息,但并非所有列表都提供了所有变量的数据,存在一定的缺失情况。此外,价格列等需要进行数据清洗,以确保数值型数据的准确性。...
    packageimg
  • 滚石乐队Spotify歌曲数据集-2021

    2025年4月15日   

    滚石乐队Spotify歌曲数据集-2021 数据来源:互联网公开数据 标签:滚石乐队,Spotify,音乐分析,数据可视化,推荐系统,聚类分析,流行度预测,数据清理 数据概述: 本数据集包含滚石乐队在 Spotify 上所有专辑的歌曲信息,共包含 2 万多个唯一 ID 的歌曲。数据集中的字段包括: name - 歌曲名称 album - 专辑名称...
    packageimg