-
DSbowl19肺部疾病诊断竞赛特征数据集
DSbowl19肺部疾病诊断竞赛特征数据集 数据来源:互联网公开数据 标签:医疗,疾病诊断,机器学习,特征工程,数据竞赛,肺部疾病,DSbowl19 数据概述: 本数据集包含了为DSbowl19(Data Science Bowl 2019)竞赛构建的特征。 这些特征旨在用于预测肺部疾病,并为参赛者提供用于构建机器学习模型的输入数据。... -
词语难度评估数据集
词语难度评估数据集 数据来源:互联网公开数据 标签:词语难度,语言学,文本简化,深度学习,特征工程,自然语言处理,词频分析,二分类问题 数据概述 本数据集包含40,481条数据记录,主要用于评估词语的难度。数据集的每个实例包含多个特征,包括词语本身、词长、词频、词频的对数变换、平均反应时间(Mean... -
洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集
洛斯阿拉莫斯国家实验室VO-CHUN-HA地震预测数据集 数据来源:互联网公开数据 标签:地震预测,机器学习,数据竞赛,时间序列,特征工程 数据概述: 本数据集来源于洛斯阿拉莫斯国家实验室举办的VO-CHUN-... -
篮球比赛NCAA2024数据集
篮球比赛NCAA2024数据集 数据来源:互联网公开数据 标签:NCAA, 篮球比赛, 预测模型, 机器学习竞赛, 历史数据, 特征工程, 比赛结果 数据概述 本数据集为 NCAA 2024 比赛相关数据,旨在为 Kaggle “March Machine Learning Mania 2024” 竞赛提供支持。数据集包含多个 CSV... -
-
-
印度黑五购物节销售数据分析数据集2021
印度黑五购物节销售数据分析数据集2021 数据来源:互联网公开数据 标签:黑五购物节,印度,零售业,消费行为,销售分析,特征工程 数据概述:... -
艾姆斯房屋价格预测数据集
艾姆斯房屋价格预测数据集 数据来源:互联网公开数据 标签:房屋价格,艾姆斯,房价预测,房地产市场,特征工程,数据建模,预测分析 数据概述: 本数据集包含艾姆斯市住宅房屋的详细信息记录,涉及79个特征变量,几乎涵盖了房屋的所有方面,包括位置、面积、建筑风格、配套设施等关键因素。数据集旨在为房价预测提供全面的背景信息,帮助预测每栋房屋的最终售价。... -
未来销售预测商品与店铺信息数据集2021
未来销售预测商品与店铺信息数据集2021 数据来源:互联网公开数据 标签:销售预测,商品信息,店铺信息,特征工程,数据翻译,市场分析 数据概述: 本数据集来源于Kaggle的“Predict Future... -
机器学习基础入门数据集
机器学习基础入门数据集 数据来源:互联网公开数据 标签:机器学习,基础入门,监督学习,非监督学习,数据集,模型评估,特征工程,偏差方差权衡 数据概述:... -
Spotify用户行为数据集
Spotify用户行为数据集 数据来源:互联网公开数据 标签:Spotify,音乐推荐,用户行为分析,特征工程,机器学习模型,音乐特征分析,协同过滤,内容推荐 数据概述: 本数据集包含250个匿名Spotify用户的听歌记录,每位用户约有100首歌曲,总数据量为28469行。每首歌曲的特征包括舞动性、愉悦性、音调、能量等,这些特征通过Spotify... -
艾姆斯房屋数据集缺失值处理版
艾姆斯房屋数据集缺失值处理版 数据来源:互联网公开数据 标签:房屋价格预测,艾姆斯,房地产分析,数据清洗,特征工程,统计建模,机器学习 数据概述: 本数据集基于Iowa Ames地区房屋销售的历史数据进行整理和工程改造,旨在为初学者提供一个易于上手的数据集,减少对缺失值处理的顾虑,专注于特征理解和模型应用。原始数据用于Kaggle上的“House... -
印度销售预测任务数据集2018-2020
印度销售预测任务数据集2018-2020 数据来源:互联网公开数据 标签:销售预测,时间序列分析,数据预处理,特征工程,机器学习算法,销售数据,零售业分析 数据概述:... -
皮马印第安人糖尿病预测分析数据集
皮马印第安人糖尿病预测分析数据集 数据来源:互联网公开数据 标签:糖尿病,预测,医疗,机器学习,数据清洗,特征工程,SMOTE,随机森林,SHAP,可解释性AI 数据概述: 本数据集是经过处理的皮马印第安人糖尿病数据集,原始数据来源于Kaggle。数据集经过了多项预处理步骤,包括: 数据清洗(处理异常值,处理缺失值)... -
印度短视频平台用户行为分析与特征工程数据集
印度短视频平台用户行为分析与特征工程数据集 数据来源:互联网公开数据 标签:用户行为,短视频平台,特征工程,数据分析,用户分析,时间序列,机器学习 数据概述: 本数据集收录了印度某短视频平台上用户在5天内的行为数据,涵盖用户观看、点赞、评论和分享等关键行为。数据集还包括用户基本信息、内容类型等特征,为深入分析用户行为模式提供了基础。 数据用途概述:... -
新闻点击诱饵数据集
新闻点击诱饵数据集 数据来源:互联网公开数据 标签:新闻,点击诱饵,在线媒体,自然语言处理,机器学习,特征工程,社交媒体分析 数据概述: 本数据集包含从不同来源收集的新闻标题及其标签,用于训练和检测点击诱饵(clickbait)内容。数据集分为两个部分:train1.csv 和 train2.csv。train1.csv 收集自 Abhijnan... -
-
竞赛中工作与非工作策略数据集
竞赛中工作与非工作策略数据集 数据来源:互联网公开数据 标签:数据科学竞赛,策略分析,特征工程,模型选择,行业分布,竞赛任务,问题类型,目标分析 数据概述:... -
钓鱼网站检测与识别URL数据集2014
钓鱼网站检测与识别URL数据集2014 数据来源:互联网公开数据 标签:钓鱼网站,URL,网络安全,特征工程,二分类,数据挖掘,机器学习 数据概述: 本数据集包含96,018条URL记录,其中48,009条为合法URL,48,009条为钓鱼网站URL。数据集以CSV文件形式存储,包含以下字段: - "domain":每个URL的唯一标识符。 -... -
银行贷款数据集-预处理版本-助力模型构建与评估
银行贷款数据集-预处理版本-助力模型构建与评估 数据来源:互联网公开数据 标签:银行贷款,机器学习,数据预处理,特征工程,模型训练,数据分析 数据概述:...