找到1,608个数据集

标签: 特征工程

过滤结果
  • KaggleDon-tOverfitII挑战赛数据集-过拟合问题研究-历史数据集

    2025年4月14日   

    KaggleDon-tOverfitII挑战赛数据集-过拟合问题研究-历史数据集 数据来源:互联网公开数据 标签:机器学习,竞赛数据,过拟合,二元分类,特征工程,数据分析,Kaggle 数据概述: 本数据集源于Kaggle Don't Overfit II...
    packageimg
  • 推特用户垃圾账号识别特征数据集

    2025年4月14日   

    推特用户垃圾账号识别特征数据集 数据来源:互联网公开数据 标签:推特,社交媒体,垃圾账号,用户行为,机器学习,数据分析,账号识别,特征工程 数据概述:...
    packageimg
  • 癌症预测数据集

    2025年4月14日   

    癌症预测数据集 数据来源:互联网公开数据 标签:癌症预测,医疗信息,生活方式,机器学习,特征工程,合成数据 数据概述:...
    packageimg
  • 螃蟹年龄合成训练数据集

    2025年4月14日   

    螃蟹年龄合成训练数据集 数据来源:互联网公开数据 标签:螃蟹,年龄预测,合成数据,机器学习,训练集,特征工程,时间序列 数据概述: 本数据集是为 Playground Series Season3 Episode16 的训练任务额外提供的合成数据。数据由“Make Synthetic Crab Age...
    packageimg
  • Python生成的模拟用户信息数据集

    2025年4月14日   

    Python生成的模拟用户信息数据集 数据来源:互联网公开数据 数据来源: 本数据集由 Python 中的 mimesis 模块人工生成,旨在为数据分析教学、建模实验和特征工程训练提供支持。该数据为合成数据,不涉及真实个人或敏感信息,可安全用于研究与教学场景。 数据内容:...
    packageimg
  • 房屋推荐合成数据集

    2025年4月14日   

    房屋推荐合成数据集 数据来源:互联网公开数据 标签:推荐系统,房屋属性,关键词提取,特征工程,推荐算法,数据合成 数据概述:...
    packageimg
  • 印度房屋价格分析与预测数据集

    2025年4月14日   

    印度房屋价格分析与预测数据集 数据来源:互联网公开数据 标签:房屋价格,印度,数据分析,预测模型,数据清理,特征工程,统计假设测试 数据概述:...
    packageimg
  • 手机价格预测数据集-手机参数特征-2024

    2025年4月14日   

    手机价格预测数据集-手机参数特征-2024 数据来源:互联网公开数据 标签:手机,价格预测,机器学习,特征工程,电池,摄像头,处理器,内存,屏幕,4G,3G,双卡,蓝牙 数据概述: 本数据集包含两个文件:train.csv 和...
    packageimg
  • URL垃圾邮件分类数据集

    2025年4月14日   

    URL垃圾邮件分类数据集 数据来源:互联网公开数据 标签:URL,垃圾邮件,二元分类,机器学习,数据清洗,特征工程,自然语言处理,网络分析 数据概述: 本数据集包含约87.5万个URL,其中三分之一被标记为垃圾邮件URL,其余为非垃圾邮件URL。数据集由The...
    packageimg
  • 回归问题中的分类数据集

    2025年4月14日   

    回归问题中的分类数据集 数据来源:互联网公开数据 标签:回归分析,分类数据,数据预处理,机器学习,特征工程 数据概述: 本数据集是一个小型数据集,适用于回归问题,其中大多数列都是分类数据。该数据集旨在帮助用户掌握在回归问题中处理分类数据的技能,提供了进行特征工程和数据预处理的实践基础。 数据用途概述:...
    packageimg
  • 亚马逊显示器交易数据集

    2025年4月14日   

    亚马逊显示器交易数据集 数据来源:互联网公开数据 标签:显示器,交易数据,亚马逊,价格预测,特征工程,数据清洗,电子商务 数据概述:...
    packageimg
  • 网络诈骗检测与预防特征工程数据集

    2025年4月14日   

    网络诈骗检测与预防特征工程数据集 数据来源:互联网公开数据 标签:网络诈骗,人工智能,区块链,预检测,特征工程,数据质量,时间序列 数据概述: 本数据集旨在支持网络诈骗检测与预防领域的研究与应用,特别关注于事前(pre-...
    packageimg
  • 巴西房地产市场分析数据集1963-2021

    2025年4月14日   

    巴西房地产市场分析数据集1963-2021 数据来源:互联网公开数据 标签:房地产市场,巴西,区域差异,房价,房屋大小,数据分析,预测模型,数据清洗,特征工程,机器学习 数据概述:...
    packageimg
  • 宠物收容所动物种类与品种预测数据集

    2025年4月14日   

    宠物收容所动物种类与品种预测数据集 数据来源:互联网公开数据 标签:宠物收养,动物分类,机器学习,预测模型,特征工程,收容所,动物,品种识别 数据概述: 本数据集旨在帮助建立一个机器学习模型,用于预测宠物收容所中动物的种类和品种。...
    packageimg
  • 房屋价格训练测试数据集

    2025年4月14日   

    房屋价格训练测试数据集 数据来源:互联网公开数据 标签:房屋价格,机器学习,数据分析,特征工程,预测模型 数据概述: 本数据集是基于Kaggle上“House Prices: Advanced Regression...
    packageimg
  • 西雅图金县房屋销售数据集

    2025年4月14日   

    西雅图金县房屋销售数据集 数据来源:互联网公开数据 标签:房地产,西雅图,金县,房屋销售,数据清洗,特征工程,机器学习,回归预测,城市规划 数据概述: 本数据集包含2014年和2015年美国西雅图金县(King...
    packageimg
  • 虚构公司员工数据集

    2025年4月14日   

    虚构公司员工数据集 数据来源:互联网公开数据 标签:员工信息,虚构数据,数据清洗,数据预处理,机器学习,特征工程 数据概述:...
    packageimg
  • 平衡DDoS攻击数据集

    2025年4月14日   

    平衡DDoS攻击数据集 数据来源:互联网公开数据 标签:DDoS攻击,网络安全,数据平衡,特征工程,机器学习,网络防御,数据集平衡 数据概述: 本数据集基于Kaggle上的原始DDoS攻击数据集进行处理,包含127122行数据和23个特征(包括标签)。为了平衡数据集,我们对少数类样本进行了过采样处理。标签值定义为0表示良性流量,1表示DDoS攻击。...
    packageimg
  • 房地产特征工程数据集

    2025年4月14日   

    房地产特征工程数据集 数据来源:互联网公开数据 标签:房地产,特征工程,数据分析,房价预测,数据清洗,数据可视化 数据概述: 本数据集包含了艾姆斯市所有住宅房屋的详细信息,共计79个解释变量,涵盖房屋的各个方面。数据集旨在帮助研究者识别影响房屋价格谈判的因素,适用于房地产市场分析、特征工程和房价预测等应用场景。 数据用途概述:...
    packageimg
  • 不均衡风险评估数据集

    2025年4月14日   

    不均衡风险评估数据集 数据来源:互联网公开数据 标签:风险评估,不均衡数据,特征工程,机器学习,分类预测 数据概述: 本数据集包含用于确定风险目标(1=高风险, 0=低风险)的不均衡且未经清理的特征集。数据集共有34个特征、1个目标变量和1个标识符列。特征包括整数、浮点数和类别数据等多种类型,适用于风险预测和分类模型的训练。 数据用途概述:...
    packageimg