-
KaggleDon-tOverfitII挑战赛数据集-过拟合问题研究-历史数据集
KaggleDon-tOverfitII挑战赛数据集-过拟合问题研究-历史数据集 数据来源:互联网公开数据 标签:机器学习,竞赛数据,过拟合,二元分类,特征工程,数据分析,Kaggle 数据概述: 本数据集源于Kaggle Don't Overfit II... -
推特用户垃圾账号识别特征数据集
推特用户垃圾账号识别特征数据集 数据来源:互联网公开数据 标签:推特,社交媒体,垃圾账号,用户行为,机器学习,数据分析,账号识别,特征工程 数据概述:... -
-
螃蟹年龄合成训练数据集
螃蟹年龄合成训练数据集 数据来源:互联网公开数据 标签:螃蟹,年龄预测,合成数据,机器学习,训练集,特征工程,时间序列 数据概述: 本数据集是为 Playground Series Season3 Episode16 的训练任务额外提供的合成数据。数据由“Make Synthetic Crab Age... -
Python生成的模拟用户信息数据集
Python生成的模拟用户信息数据集 数据来源:互联网公开数据 数据来源: 本数据集由 Python 中的 mimesis 模块人工生成,旨在为数据分析教学、建模实验和特征工程训练提供支持。该数据为合成数据,不涉及真实个人或敏感信息,可安全用于研究与教学场景。 数据内容:... -
-
印度房屋价格分析与预测数据集
印度房屋价格分析与预测数据集 数据来源:互联网公开数据 标签:房屋价格,印度,数据分析,预测模型,数据清理,特征工程,统计假设测试 数据概述:... -
手机价格预测数据集-手机参数特征-2024
手机价格预测数据集-手机参数特征-2024 数据来源:互联网公开数据 标签:手机,价格预测,机器学习,特征工程,电池,摄像头,处理器,内存,屏幕,4G,3G,双卡,蓝牙 数据概述: 本数据集包含两个文件:train.csv 和... -
URL垃圾邮件分类数据集
URL垃圾邮件分类数据集 数据来源:互联网公开数据 标签:URL,垃圾邮件,二元分类,机器学习,数据清洗,特征工程,自然语言处理,网络分析 数据概述: 本数据集包含约87.5万个URL,其中三分之一被标记为垃圾邮件URL,其余为非垃圾邮件URL。数据集由The... -
回归问题中的分类数据集
回归问题中的分类数据集 数据来源:互联网公开数据 标签:回归分析,分类数据,数据预处理,机器学习,特征工程 数据概述: 本数据集是一个小型数据集,适用于回归问题,其中大多数列都是分类数据。该数据集旨在帮助用户掌握在回归问题中处理分类数据的技能,提供了进行特征工程和数据预处理的实践基础。 数据用途概述:... -
-
网络诈骗检测与预防特征工程数据集
网络诈骗检测与预防特征工程数据集 数据来源:互联网公开数据 标签:网络诈骗,人工智能,区块链,预检测,特征工程,数据质量,时间序列 数据概述: 本数据集旨在支持网络诈骗检测与预防领域的研究与应用,特别关注于事前(pre-... -
巴西房地产市场分析数据集1963-2021
巴西房地产市场分析数据集1963-2021 数据来源:互联网公开数据 标签:房地产市场,巴西,区域差异,房价,房屋大小,数据分析,预测模型,数据清洗,特征工程,机器学习 数据概述:... -
宠物收容所动物种类与品种预测数据集
宠物收容所动物种类与品种预测数据集 数据来源:互联网公开数据 标签:宠物收养,动物分类,机器学习,预测模型,特征工程,收容所,动物,品种识别 数据概述: 本数据集旨在帮助建立一个机器学习模型,用于预测宠物收容所中动物的种类和品种。... -
房屋价格训练测试数据集
房屋价格训练测试数据集 数据来源:互联网公开数据 标签:房屋价格,机器学习,数据分析,特征工程,预测模型 数据概述: 本数据集是基于Kaggle上“House Prices: Advanced Regression... -
西雅图金县房屋销售数据集
西雅图金县房屋销售数据集 数据来源:互联网公开数据 标签:房地产,西雅图,金县,房屋销售,数据清洗,特征工程,机器学习,回归预测,城市规划 数据概述: 本数据集包含2014年和2015年美国西雅图金县(King... -
-
平衡DDoS攻击数据集
平衡DDoS攻击数据集 数据来源:互联网公开数据 标签:DDoS攻击,网络安全,数据平衡,特征工程,机器学习,网络防御,数据集平衡 数据概述: 本数据集基于Kaggle上的原始DDoS攻击数据集进行处理,包含127122行数据和23个特征(包括标签)。为了平衡数据集,我们对少数类样本进行了过采样处理。标签值定义为0表示良性流量,1表示DDoS攻击。... -
房地产特征工程数据集
房地产特征工程数据集 数据来源:互联网公开数据 标签:房地产,特征工程,数据分析,房价预测,数据清洗,数据可视化 数据概述: 本数据集包含了艾姆斯市所有住宅房屋的详细信息,共计79个解释变量,涵盖房屋的各个方面。数据集旨在帮助研究者识别影响房屋价格谈判的因素,适用于房地产市场分析、特征工程和房价预测等应用场景。 数据用途概述:... -
不均衡风险评估数据集
不均衡风险评估数据集 数据来源:互联网公开数据 标签:风险评估,不均衡数据,特征工程,机器学习,分类预测 数据概述: 本数据集包含用于确定风险目标(1=高风险, 0=低风险)的不均衡且未经清理的特征集。数据集共有34个特征、1个目标变量和1个标识符列。特征包括整数、浮点数和类别数据等多种类型,适用于风险预测和分类模型的训练。 数据用途概述:...